【视频解说】:Nature|首个健康大模型PH-LLM，睡眠与健身指导超越人类专家-动态资讯-北京联索科技有限公司

动态资讯

【视频解说】:Nature|首个健康大模型PH-LLM，睡眠与健身指导超越人类专家

2026-02-08 09:18:02 腾讯 [查看原文]

科研、项目、商务合作：nnhhce (注明来意,清北硕博团队专注于AI for Science大模型)

独家整理，盗用必究

论文视频解说👇👇👇

可穿戴设备已经成为现代人健康管理的重要工具，但如何将海量的传感器数据转化为真正有价值的个性化健康建议，一直是行业难题。近日，Google Research团队在Nature Medicine期刊发表重磅研究，推出了首个专门针对个人健康监测的大语言模型——PH-LLM（Personal Health Large Language Model），在睡眠医学和健身指导方面的表现超越了人类专家。为何需要专门的个人健康大模型？

传统的大语言模型虽然在医学问答、电子病历分析等临床场景表现出色，但在处理可穿戴设备产生的连续、多模态的个人健康数据时却面临挑战。这些数据通常缺乏临床背景、计算密集、难以解读，且不包含在标准医学数据集中。更关键的是，现有的通用大模型和医疗专用模型都无法有效利用这些数据来推理个人健康行为并提供干预建议。

研究团队指出，睡眠、体力活动、压力和心脏代谢健康等生活方式特征对不良健康结果、发病率和整体健康有深远影响，可通过可穿戴设备被动、连续地测量。然而，这些特征尚未在临床实践中广泛使用，也未纳入医学问答的标准数据集。PH-LLM的整体设计框架是什么？

【论文图1：PH-LLM的整体实验设计示意图】

如图1a所示，PH-LLM基于Gemini Ultra 1.0进行微调，评估体系包含三个维度：（1）通过专业认证考试评估领域知识水平；（2）生成针对睡眠和健身目标的个性化洞察和建议；（3）从可穿戴传感器数据预测主观睡眠质量的患者报告结果（PROs）。

研究团队采用两阶段训练策略：第一阶段对整个模型进行长文本案例研究的微调，训练数据包含人口统计信息、最多30天的日常指标、聚合统计数据，对于健身案例还包括单独的运动日志和合成生成的锻炼准备评估。第二阶段针对睡眠质量预测任务微调多模态适配器，使用至少15天的纵向被动传感器数据，包含日常睡眠和活动指标。专业考试表现如何超越人类专家？

【表1：专业考试问题库的表现对比】

考试类型

及格/学分要求

人类专家

Gemini Ultra 1.0

PH-LLM

睡眠医学

70%

76%

77%79%

健身认证

70%

71%

88%88%

研究团队编制了629道睡眠医学选择题（来自美国内科医学委员会睡眠医学认证考试风格）和99道健身认证题（模拟美国国家力量与体能协会CSCS考试）。结果显示，PH-LLM在睡眠医学考试中得分79%，显著超过人类专家的76%；在健身考试中得分88%，同样远超专家的71%。

更值得注意的是，当按题目难度分层分析时（基于人类考生的答对率），PH-LLM在困难题目上的提升更明显。如表2所示，在简单题目（90-100%答对率）中，PH-LLM得分95%；在中等题目（75-90%答对率）中得80%；而在困难题目（0-75%答对率）中仍能达到57%，超过Gemini Ultra 1.0的55%和专家的53%。

研究还进行了消融实验，发现自洽性（self-consistency）采样（

轮）和思维链（Chain-of-Thought）提示能进一步提升性能。具体来说，自洽性在健身考题中对CoT和非CoT提示都有改善，而少样本提示（few-shot prompting）结合自洽性在两个考试中都获得了额外的性能提升。如何生成个性化的案例研究建议？

【论文图2：睡眠和健身案例研究的输入数据与专家分析示意图】

案例研究数据集是本研究的核心创新。研究团队创建了857个详细的个人健康案例研究（507个睡眠案例+350个健身案例），每个案例包含数周的可穿戴传感器数据和相应的长文本洞察与建议。睡眠案例研究的数据结构

如图2a所示，每个睡眠案例包含：

人口统计信息：年龄和自报性别

每日睡眠指标（最多29天）：就寝时间、起床时间、睡眠阶段持续时间等16个指标

聚合睡眠统计：各项指标的均值、百分位数、最小值、最大值、第5和第95百分位数

专家响应分为三个部分：

洞察（Insights）：基于RU-SATED框架（常规性、睡眠质量、警觉性、时机、效率、持续时间）系统评估用户的睡眠模式。例如："中睡眠点标准差为44分钟，表明睡眠时间表规律"、"平均睡眠时长为5小时28分钟，低于健康范围"。

病因学（Etiology）：分析昼夜节律、稳态驱动、心理生理性过度觉醒和外部因素的贡献。如："用户有规律的睡眠时间表，意味着他们有规律的昼夜节律"、"用户睡眠时间短且不午睡，大多数记录的睡眠时间少于6小时"。

建议（Recommendations）：提供SMART原则（具体、可衡量、可实现、相关、有时限）的个性化建议。例如："更好的睡眠时间表是每天从凌晨12:00到早上7:30，这将提供足够的睡眠机会"、"可以每隔几天将睡眠时间表调整15分钟，直到达到目标"。健身案例研究的综合分析

如图2b所示，健身案例更为复杂，包含：

人口统计：年龄、自报性别、身高、体重、BMI

训练负荷数据（最多30天）：脂肪燃烧区、有氧区、峰值区的分钟数、训练冲量（TRIMP）、步数等

睡眠指标：9项日常睡眠指标及其聚合统计

健康指标：静息心率、心率变异性（HRV）、呼吸频率等

专家响应分为五个部分，最终综合形成准备度评估（1-5分）和具体的训练建议。例如："由于睡眠时间略短、静息心率升高和HRV RMSSD显著降低，训练者准备度为2/5"、"考虑降低训练强度或持续时间以适应恢复能力下降"。评估方法：如何确保结果的客观性？

研究团队设计了一套15个问题的详细评分标准（5分Likert量表），涵盖：使用重要领域知识、正确引用相关用户数据、避免虚构、潜在危害、可读性和整体质量等维度。

为了评估评分者间信度，多位专家对同一案例评分。结果显示，Gwet's AC2系数在0.699至0.956之间（如Extended Data Fig. 3所示），表明中等到良好的评分者一致性。

【论文图2c-d：各子部分的专家评分对比】

如图2c所示，在睡眠案例中：

PH-LLM的整体平均评分为4.61，而人类专家为4.75（

，

）

虽然差异具有统计学意义，但效应量很小，且PH-LLM有73%的时间获得最高评分

相比Gemini Ultra 1.0（4.51），PH-LLM显著提升（

）

微调显著改善了洞察和病因学部分：

洞察：

，

病因学：

，

如图2d所示，在健身案例中，PH-LLM与人类专家表现无显著差异（

，

）。四个部分中有三个（人口统计、睡眠指标、健康指标）无统计学差异，仅训练负荷部分人类专家和Gemini Ultra 1.0评分略高于PH-LLM（

，

）。技术核心：多模态适配器如何预测主观感受？

【论文图3：患者报告结果（PRO）预测性能】

为了评估PH-LLM能否从客观传感器数据推断主观睡眠体验，研究团队使用了Google数字健康研究数据集，包含4,163名参与者的可穿戴数据和PROMIS睡眠干扰与睡眠损害问卷（共16个问题）。数据预处理与特征工程

如图3a所示，16个问卷问题测量相关但不同的睡眠结果，彼此之间存在中等到强的相关性。图3b展示了线性回归模型中各传感器特征的重要性：没有单一特征主导所有PRO的预测能力，预测信号分散在多个传感器中。例如，睡眠持续时间、深度睡眠时长、静息心率和心率变异性对不同问题的预测贡献各异。多模态适配器架构

研究团队训练了一个多层感知机（MLP）适配器，将传感器特征映射到PH-LLM的隐空间：

输入层：对20个传感器特征进行z-score标准化，计算15天的均值和方差，形成

的矩阵

隐藏层：三个全连接层，尺寸分别为1,024、4,096、1,024，每层后接ReLU激活函数

输出层：将输入投影为4个"软标记"（soft tokens），维度为

（其中14,336是PH-LLM的标记嵌入维度）

这4个软标记作为文本提示的前缀传递给PH-LLM

训练时仅优化适配器参数，PH-LLM权重保持冻结，最小化交叉熵损失：

其中

是第

个样本对第

类（是/否）的真实标签，

是模型预测概率。训练超参数包括：批大小8，学习率

，线性预热50步后余弦衰减，最多30,000步。预测性能分析

如图3c所示，在测试集（

）上，带适配器的PH-LLM在AUROC上显著优于零样本和少样本提示方法。对于大多数问题，AUROC在0.55-0.70范围内，其中某些问题达到约0.68。虚线表示随机分类器的AUROC（0.5）。标注"*"的结果表明，适配器方法与两种提示方法在100次配对自举迭代中的AUROC差异的置信区间均不包含0。

图3d展示了AUPRC（精确率-召回率曲线下面积）性能，每个柱状图顶部的横线表示该问题的阳性样本流行率（即随机分类器的AUPRC）。带适配器的PH-LLM在多数问题上的AUPRC显著高于流行率基线，表明其预测具有实际价值。与传统机器学习方法的对比

研究团队还比较了PH-LLM与逻辑回归和卷积神经网络（CNN）的性能（Extended Data Fig. 9）。结果表明：

PH-LLM与逻辑回归在AUROC上无显著差异，在16个结果中仅1个AUPRC有显著差异

CNN由于数据集规模有限，表现劣于逻辑回归

在低数据场景下，LLM未显示出利用先验知识的优势，可能因为可穿戴传感器数据在LLM训练语料中表示有限消融实验的发现

上下文窗口长度：使用仅5天传感器数据导致AUROC和AUPRC降低，而使用10天或15天性能相近（Supplementary Fig. 9）。这符合PROMIS睡眠问卷涉及过去7天的设计。

训练样本数量：从25%增加到50%训练样本时性能显著提升（

），从50%到100%提升较小（Supplementary Fig. 10），表明更多训练数据可能进一步改善性能。

数据增强：在适配器输入中添加零均值、0.001标准差的高斯噪声后，AUPRC普遍更高（虽然误差条较宽）（Supplementary Fig. 11），提示数据增强可能适度改善性能。自动评估系统：如何加速模型迭代？

人工评估案例研究既费力又耗时。为了扩大消融研究范围，研究团队训练了AutoEval模型——另一个LLM专门用于根据评分标准自动评估响应。

AutoEval基于较小的Gemini Pro 1.0，使用LoRA（低秩适应）微调，参数包括：

LoRA秩：4（作用于注意力头）

初始化：A矩阵随机高斯初始化，B矩阵零初始化

优化器：Adafactor，常数学习率

，衰减0.995，梯度裁剪阈值1.0

最多20轮，全局批大小32

评估数据集包含6,552条睡眠评分（4,872训练+1,596验证）和9,331条健身评分（7,138训练+2,193验证）。研究团队训练了四种候选模型：未调优的Gemini Pro 1.0基线、包含所有评分的"All"模型、仅包含评分方差最高专家的"High variance"模型、仅包含方差最低专家的"Low variance"模型。

最佳AutoEval模型在验证集上达到了与人类专家相似的一致性水平（Extended Data Fig. 6），且评分时间大幅缩短（Supplementary Table 22）。使用AutoEval进行的消融实验（Extended Data Fig. 7-8）显示：

PH-LLM在睡眠洞察和病因学部分显著优于领先的外部模型

使用完整数据集训练相比仅25%样本，睡眠洞察和病因学评分显著提升研究的局限性与未来方向

研究团队坦诚指出了几个局限性：

评分主观性：开放式辅导任务的长文本评估本质上具有主观性，评分分布偏高，难以区分模型和专家响应。

评分者偏见：大多数案例由单一专家评分所有候选响应，虽然便于直接比较，但可能基于风格等非实质性因素识别专家响应，引入有意或无意的偏见。

数据虚构：尽管在引用和整合用户数据方面有所改进，虚构和错误引用用户数据仍偶尔发生，这对安全有效部署至关重要。

样本代表性：案例研究在人口统计学上广泛采样（睡眠）或识别活跃个体的常见模式（健身），但可能不代表总体人群。案例研究和Fitbit研究人群不采集种族或民族信息，样本可能是美国人口的偏倚子集。健身案例富集了30-59岁男性参与者，数字健康研究的自我选择导致女性参与者偏多。

输入表示：仅考虑了案例研究数据的文本表示，因为数据集中缺少持久化的原始时间序列。探索原始传感器数据中更丰富的时间信号是未来重要方向。

多模态编码探索有限：由于数据集相对较小（传感器数据几乎完整且配对结果数据），对传感器数据多模态编码的探索仅涉及一小部分建模可能性。进一步探索原始波形和细粒度聚合传感器特征的自监督预训练，可能产生对个人健康结果预测更有用的个体表示。

缺失数据挑战：虽然使用日常传感器测量并对案例研究施加选择标准在很大程度上避免了缺失数据挑战，但按数据缺失分层的分析和传感器数据消融实验表明PH-LLM对缺失具有鲁棒性，仍需进一步探索。

长期健康结果：开发个人健康专用模型的主要目标是通过有效的行为改变和健康习惯维持来改善长期健康结果。盲法用户偏好研究可以提供模型有效性和相对于专家辅导表现的重要证据。

安全性和公平性：虽然本研究中PH-LLM的表现令人鼓舞，但确保LLM在个人健康应用中可靠、安全和公平还需要大量工作。进一步减少虚构、考虑传感器信息无法捕获的个体独特健康状况、确保训练数据与真实世界分布对齐，都是值得进一步关注的重要研究领域。临床意义与应用前景

这项研究的意义不仅在于技术突破，更在于其对个人健康管理范式的潜在变革。传统临床就诊虽提供宝贵信息，但仅能定期评估生活方式特征，而可穿戴设备实现了被动、连续的监测。PH-LLM架起了传感器数据与可操作健康建议之间的桥梁，使得：

大规模个性化成为可能：传统上，详细的睡眠和健身指导需要专业教练一对一服务，成本高昂且难以规模化。PH-LLM能以接近专家水平提供个性化建议，使更多人受益。

连续性健康管理：不同于定期体检的快照式评估，基于可穿戴设备的持续监测配合LLM分析，可以实时识别健康模式变化并及时干预。

整合多模态信息：PH-LLM同时处理客观传感器数据和主观自我报告，提供更全面的健康画像。其预测PRO的能力使其能够理解个体的主观感受，从而提供更贴合需求的建议。

辅助临床决策：虽然本研究聚焦于非临床的睡眠和健身指导，但其方法论可扩展到其他健康领域，为临床医生提供患者日常健康行为的深入洞察，作为传统临床评估的补充。数据与代码开放性

研究团队展现了高度的科研透明度。所有857个案例研究的输入数据、专家响应和模型响应均以JSON格式公开，可在GitHub仓库获取（https://github.com/google-health/consumer-health-research/blob/main/phllm/data/）。PRO任务的输入和预测数据（包含年龄分桶、20个传感器的15天读数和16个二元调查响应）在签署数据使用协议后可向google-digital-wellbeing-dataset@google.com申请。

代码库包含：案例研究数据集交互、模型响应自动评估、MCQ考试查询与评估、PRO预测多模态适配器的参考实现、分析和数据可视化工具。总结与展望

Google Research团队的这项工作标志着大语言模型在个人健康监测领域的重要里程碑。PH-LLM不仅在专业考试中超越人类专家，更在真实案例指导中达到专家水平，证明了AI辅助个人健康管理的巨大潜力。

正如研究团队所述："尽管存在这些局限性，本研究表明基于Gemini的模型包含大量健康知识，并能有效微调Gemini Ultra 1.0以提升多个个人健康相关结果的性能。"该研究提供的基准任务套件、详尽的专家对比评估以及对当前LLM优势与不足的分析，为未来开发更强大的个人健康助手奠定了坚实基础。

随着可穿戴设备的普及和大语言模型技术的成熟，个性化、智能化的健康指导将从少数人的特权变为大众可及的服务。PH-LLM的成功表明，这一愿景的实现比我们想象的更近。

论文引用：

Khasentino, J., Belyaeva, A., Liu, X. et al. A personal health large language model for sleep and fitness coaching. Nat Med (2025). https://doi.org/10.1038/s41591-025-03888-0

项目地址：

数据与代码：https://github.com/google-health/consumer-health-research/tree/main/phllm

睡眠案例数据：https://github.com/google-health/consumer-health-research/blob/main/phllm/data/sleep_case_studies.all.jsonl

健身案例数据：https://github.com/google-health/consumer-health-research/blob/main/phllm/data/fitness_case_studies.all.jsonl

论文视频解说👇👇👇

———— end ————

更多更深层次医疗大模型知识尽在👇

科研、项目、商务合作：nnhhce (注明来意,清北硕博团队专注于AI for Science大模型)

OCR:IMG:Fitness 5 7.19 4.81 4.80 4,81 4.82 4.76 4,84 4.68 4.73 4.75 4.77 42 4.71 4 3 2 n=744 n=768 =743 n=768 n-744 n=768 1=744 n=839 Trainingload Sleep Health metrics Assessment Section

OCR:IMG:Examplefitnesscasestudywithexpertresponse 40-45-year-oldfemale Height:1.57m,weight:61.25kg,BMI24.8 Goal:I'dlikearecoveryplan. (i)Trainingloadmetrics 口 Moderate 100.0 国 Vigorous Peak 80.0 60.0 40.0 20.0 0 (i Sleepmetrics Sleepintervals 18:00 200 300 400 500600 700800 1 Sleep duration 20:00 川hu 1 22:00 0:00 o 2:00 4:00 6:00 8:00 10:00 12:00 14:00 16:00 18:00 医工交叉AI大模型 Fri SunTueThuSatMonWedFri Sun lue Thul SatMonWedFri

OCR:IMG:cMeKGgithubChineseMedicalKnowledgeGraph 瑞金医院人工智能辅助构建知识图谱大赛糖尿病相关的学术论文以及糖尿病临床指南的实体标注和抽取实体关系任务）OMAHA知识图谱（药品适应症）开放医疗与健康联盟（OpenMedicalandHealthcareAlliance，OMAHA）构建的药品与药品适应证的知识图谱数据医疗知识图谱数据医疗知识图谱数据（ownthink）病人事件图谱数据集病人事件图谱是一种新的基于RDF的医疗观察性数据表示模型，可以清晰地表示临床检查、诊断、治疗等多种事件类型以及事件的时序关系。使用三家上海三甲医院的电子病历数据，构建了包括3个专科、173395个医疗事件、501335个事件时序关系以及与5313个知识库概念链接的医疗数据集。中文症状库这是一个包含症状实体和症状相关三元组的数据集。中文症状库的数据来自8个主流的健康咨询网站、3个中文百科网站和电子病历。它还包含了中文症状与UMLS中概念的链接结果。中医医案知识图谱从医案中抽取临床知识构建知识图谱，帮助用户了解中医特色疗法，以及疾病（如慢性胃炎"）的临床表现、相关疗法、相关养生保健方法等 herbnet面向中药研究，根据中药领域模型的特点，构建了一个包括中医疾病，方剂，中药，中药化学成分药理作用，中药实验，化学实验方法在内的中药本体。进而，基于本体实现了一系列数据库的集成，从而构建了一个中药知识图谱。 1 CHIP2020中文医学文本实体关系抽取 CCKS2020新冠知识图谱构建与问答公众号·医工交叉AI大模型 cmekg医学关系提取工具 cmekg医学关系提取

OCR:IMG:ChineseEHRBert中文电子病历预训练Bert；用Bert测试命名实体识别，问答模型，关系提取任务 MC-BERTChineseBLUE数据集和模型 bertcner用于命名实体识别的预训练的中文医学Bert模型 PCL-MedBERT鹏城医疗BERT预训练模型 medbertBERT模型在中文临床自然语言处理中的应用探索与研究 Chinese-Word2vec-Medicine中文生物医学领域词向量 SMedBERTSMedBERT 公众号·医工交叉A大模型 eHealthBuildingChineseBiomedicalLanguageModelsviaMulti-LevelTextDiscrimination

OCR:IMG:Q Q."What type of muscular (a)Concentric a) contractionoccursinthe (b)Isometric pectoralismajorduringthe (c) Myocentric b) slow,controlled,downward (d)Eccentric c) phase ofabenchpress? Key d) Insights Domainknowledge Sensorgrounding Coachingrecommendations Recommendation Theyarehavingtroublefalling asleep.Otherwise,goodsleep Metric Avg... Pct Min Max efficiencyof86%,abovethe O Bedtime 01:01 94% 23:29 03:32 Q."You area sleepmedicine recommendedrangeof Sleep duration 05:28 7% 03:52 07:57 80-85%.Adequate deep sleep ? expert.You aregiven the following sleep data.Theuser (1hour),important forphysical *** - *2. *** PH-LLM recovery.Consistent sleep Restlessness score 0.116 78% 0.060 0.184 is male,50yearsold.List the schedule and nonaps. Sleep score 69.52 4% 55.45 84.65 mostimportant insights..." Makesureyourbedroom is cool and dark.Continue to PROS avoidnaps and keepinga consistent schedule. Q.“Based on this wearable HRS data,would the userreport havingdifficultyfalling HRV asleep?" Thisperson islikelytoreport Sleepe thattheyexperiencediffculty Stepsm falling alseepseveral times overthepastmonth. Dailyresolution Sensor-based sensordata mean&variance Personal health LLM (PH-LLM)

OCR:IMG:Sleep 4.75 4.82 48 4.83 4.58 4.D3 4.68 4:51 3 2 一 Gemini Ultra 一 PH-LLM Humanexpert n=800 n=1312 n=B02 n=801 n=1.311 n=803 =B01 n=1312 n=800 Insights Etiology Recommendations Section

OCR:IMG:Trouble stayingawake 1.0 Slduetoirritability 0.9 Tiredness Sleepyduringdaytime -0.8 Troublebeingproductive nbn Having problems SI dueto troubleconcentrating 0.7 Correlation Troublefallingasleep 0.6 Troublestayingasleep Veryrestless Troublesleeping 0.5 Alert 一 0.4 Enoughsleep Quality 0.3 Satisfied Refreshed e s m s o ae s sns sno no s Surveyquestion

OCR:IMG:Trouble stayingawake 1.0 Slduetoirritability Tiredness 0.9 Sleepyduringdaytime -0.8 Troublebeingproductive nbns Havingproblems SI dueto trouble concentrating 0.7 Correlation Troublefallingasleep 0.6 Troublestayingasleep Veryrestless Troublesleeping 0.5 Alert 0.4 Enoughsleep Quality 0.3 Satisfied Refreshed e s pbs e s ae n s oe eno s 公众号·医工交叉AI大模型 Surveyquestion

OCR:IMG:Examplesleepcasestudywithexpertresponse 65-70-year-oldmale Goal:I'dliketoimprovemysleep. (i)Bedtimesandwake times 0.70 0.75 0.80 0.85 0.90 0.95 18:00 Sleep efficiency 20:00 22:00 0:00 三三 Aepo 2:00 4:00 6:00 8:00 10:00 12:00 14:00 16:00 18:00 Wed ThuFri Sat Sun Mon Tue Wed Thu Fri SatSun Mon TueWedThu FriSatSun Mon TueWed Thu Fri Sat Sun Mon Tue

OCR:IMG:盼盼邀请你加入星球，一起学习医工交叉AI大模型星主：盼盼清华北大计算机创业团队，专注于医疗大模型研发该知识星球包括论文代码复现、 transformer、扩散模型训练大模型技术，医疗智能体等等点击此处进入公众号·医工交叉AI大模型

OCR:IMG:Alert ]* Tiredness ]* Satisfied ]* Refreshed ]* Sleepyduringdaytime ]* Veryrestless ]* Troublefalling asleep ]* Enoughsleep ]* Trouble stayingasleep ]* SIdueto troubleconcentrating ]* Troublesleeping ]* SIduetoirritability ]* Troublebeingproductive Havingproblems Quality ]* PH-LLMw/adapter Troublestayingawake ]* PH-LLMfew-shot PH-LLMzero-shot + + + ? + 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 AUROC

OCR:IMG:? 《RAG（检索增强生成）原理：如何结合知识库与文本生成》 ? 《初识预训练模型：BERT、GPT系列与它们在医疗文本处理中的应用》 P 《搭建一个简单的检索系统：ElasticSearch与向量检索的入门示例》 ? 《搭建医疗数据科学坏境：硬件配置、软件依赖与常见工具》 ? 《基于中文医疗语料的预训练模型微调方法实战》 ? 《医疗数据预处理入门：数据清洗、去重与缺失值处理》 ? 《医疗文本的语义理解：上下文分析与实体关系抽取》 ® 《医疗文本数据采集与管理：数据来源、格式与合规性要求》 P 《医学术语与标准：ICD、SNOMED、LOINC等专业术语体素解析》 ? 《自然语言处理（NLP）在医疗领域的基础：分词、词性标注与命名实体识别》 ? 如何构建医疗知识库：从结构化数据到本体构建》公众号·医工交叉AI大模型

OCR:IMG:CCIR2019CCIR2019基于电子病历的数据查询类问答 cMedQA中文医学QA数据集 cMedQA2中文医学QA数据集 CMID中文医学QA意图理解数据集 KGQA基于医药知识图谱的智能问答系统 chatbot-base-on-Knowledge-Graph使用深度学习方法解析问题知识图谱存储查询知识点基于医疗垂直领域的对话系统中文医疗对话数据集Chinesemedicaldialoguedata中文医疗对话数据集 webMedQAwebMedQA MedDialogTheMedDialogdatasetcontainsconversations(inChinese)betweendoctorsandpatients.Ithas 1.1milliondialoguesand4millionutterances. CHIP2020中医文献问题生成 NLPECAMedicalMulti-ChoiceQuestionDatasetfortheNationalLicensedPharmacistExaminationinChina CCKS2021蕴含实体的中文医疗对话生成 IMCS21CBLUE@Tianchi中医疗对话数据集IMCS21 公众号·医工交叉AI大模型 EMPECExaminations-for-Medical-PErsonnel-in-Chinese（EMPEC)

OCR:IMG:Alert ]* Tiredness ]* Satisfied ]* Refreshed ]* Sleepyduringdaytime ]* Veryrestless ]* Troublefallingasleep ]* Enoughsleep ]* Troublestayingasleep ]* SIduetotroubleconcentrating ]* Trouble sleeping ]* SI duetoirritability ]* Troublebeingproductive Havingproblems Quality ]* PH-LLMw/adapter Troublestayingawake ]* PH-LLMfew-shot PH-LLMzero-shot + + 0 0.1 0.2 0.30.4号0.5医10.6叉0.7模08 AUROC

OCR:IMG:Fitness 5 7.15 4.81 4,80 4.81 4.82 4.76 4,84 4.73 4.75 4.77 4.58 4.72 4.71 4 3 2 =744 n=768 =743 n=768 1=744 -1.188 n=768 n=744 =138 n=839 Trainingload Sleep Healthmetrics医工Assessme型 Section

OCR:IMG:Examplesleepcasestudywithexpertresponse 65-70-year-oldmale Goal:I'dliketoimprovemysleep. (i)Bedtimesand wake times 0.70 0.75 0.80 0.85 0.90 0.95 18:00 Sleepefficiency 20:00 22:00 0:00 三 2:00 4:00 6:00 8:00 10:00 12:00 14:00 16:00 公众号·医工交叉AI大模型 18:00 Wed Thu FriSatSun Mon Tue Wed Thu FriSatSun Mon TueWed Thu FriSatSun Mon TueWed Thu FriSatSun Mon Tue

OCR:IMG:Alert 一 Tiredness 7 Satisfied ] Refreshed ] J Sleepyduringdaytime ] Veryrestless Troublefallingasleep 了 Enoughsleep 了 Troublestayingasleep ] Slduetotrouble ] concentrating Troublesleeping ]* SIduetoirritability Troublebeingproductive Havingproblems Quality PH-LLMw/adapter 一 PH-LLMfew-shot Troublestayingawake PH-LLMzero-shot Prevalence 0 0.05 0.10 0.15 0.20 0.25 0.30 AUPRC

OCR:IMG:? Q."Whattypeofmuscular (a)Concentric a) contractionoccursinthe (b)Isometric pectoralismajorduringthe (c)Myocentric b) slow,controlled，downward (d)Eccentric C) phaseofabenchpress?" Key d Insights Domainknowledge Sensorgrounding Recommendation They arehaving troublefalling Coachingrecommendations asleep.Otherwise,goodsleep Metric Avg ... Pct Min Max efficiencyof86%,abovethe ? Bedtime 01:01 94% 23:29 03:32 Q."Youareasleepmedicine recommendedrangeof ? Sleepduration 05:28 7% 03:52 07:57 80-85%.Adequatedeepsleep expert.Youaregiventhe followingsleepdata.Theuser (1hour),importantforphysical **. *** ... "re PH-LLM recovery.Consistentsleep Restlessness score 0.116 78% 0.060 0.184 ismale,50yearsold.Listthe scheduleandnonaps. Sleepscore 69.52 4% 55.45 84.65 mostimportantinsights.. Makesureyourbedroomis cooland dark.Continue to PROS avoidnapsandkeepinga consistentschedule. Q."Based on this wearable HR data,would theuserreport havingdifficultyfalling HRV asleep?" Thispersonislikelytoreport Sleep口 thattheyexperiencediffculty Stepsm falling alseepseveral times overthepastmonth. Dailyresolution Sensor-based sensordata mean&variance 公众号·医工交叉AI大模型 Personalhealth LLM(PH-LLM)

OCR:IMG:Examplefitnesscasestudywithexpertresponse 40-45-year-oldfemale Height:1.57m,weight:61.25kg,BMl24.8 Goal:I'dlikearecoveryplan. (i)Trainingloadmetrics 厦 Moderate 100.0 三 Vigorous Peak 80.0 60.0 40.0 20.0 0 (ii)Sleep metrics Sleepintervals 18:00 200 300 400 500600 700 Sleep duration 800 、 20:00 mhlnnn 22:00 0:00 2:00 4:00 6:00 8:00 10:00 12:00 14:00 16:00 18:00 Fri SunTueThu SatMon Wed Fri SunTueThuSatMonWed

OCR:IMG:医工交叉AI大模型知识星球（持续更新）生物大模型今天修改自Qilin-Med-VL中文多模态医疗大模型一一从安装到实际应用的完整指南自MedFound大模型诊断辅助系统完全指南：从安装到临床实践目MedAlpaca实战教程：大语言模型提升医疗工作效率自MedicalDataforMachineLearning/机器学习医疗公开数据自本草（BenTsao）[原名：华驼（HuaTuo)]医学大语言模型实践应用教程自MedicalGPT实战指南：从零开始构建你自己的医疗大语言模型自OpenEMR电子病历系统详细使用指南：从安装到临床应用自中文医学语言公开资源整理：术语集/语料库/词向量/预训练模型/知识图谱/命名实目医疗自然语言处理领域：评测/比赛，数据集，论文和预训练模型资源汇总自本地部署deepseek+dify+6科室医疗知识库，实现智能问诊目透析患者大模型检索增强生成（RAG）系统目近两年临床自然语言处理方向的医疗AI大模型整理详述目医疗数据与大语言模型：从结构化到非结构化目检索增强生成（RAG）在医疗文本处理中的最新进展详细整理（2023-2025）目大语言模型在医疗领域的应用详细整理自医疗大模型训练中的数据采集、预处理与质量控制深度探讨目利用大语言模型实现医疗问答系统精准回答的研究详细整理自自适应学习与微调：医疗场景下大语言模型的二次训练策略公众亏医工交叉AI大模型三大证

OCR:IMG:Alert ? Tiredness ] Satisfied ] Refreshed 了 Sleepyduringdaytime ] Veryrestless ] Troublefallingasleep 了 Enoughsleep 了 Troublestaying asleep ] Slduetotrouble 了 concentrating Trouble sleeping ] SIduetoirritability ]* Troublebeingproductive Havingproblems Quality PH-LLMw/adapter 一 PH-LLMfew-shot Troublestayingawake PH-LLMzero-shot Prevalence 0 0.05 0.10 .2工交2A1大模2 AUPRC

OCR:IMG:Sleep 4.75 4.82 478 4.83 .58 4.D3 4.68 3 2 一 Gemini Ultra 一 PH-LLM Humanexpert n=800 n=1312 n=B02 n=B01 n=1311 n=803 =B01 n=1312 n=800 Insights Etiology公众号Recommendation族型 Section

OCR:IMG:Nenty taln 福 20/00 图片

OCR:IMG:ChineseEHRBert中文电子病历预训练Bert；用Bert测试命名实体识别，问答模型，关系提取任务 MC-BERTChineseBLUE数据集和模型 bertcner用于命名实体识别的预训练的中文医学Bert模型 PCL-MedBERT鹏城医疗BERT预训练模型 medbertBERT模型在中文临床自然语言处理中的应用探索与研究 Chinese-Word2vec-Medicine中文生物医学领域词向量 SMedBERTSMedBERT 公众号·医工交叉AI大模型 eHealthBuildingChineseBiomedicalLanguageModelsviaMulti-LevelTextDiscrimination

内容提及地域：上海市、上海市

IP属地：中国北京

本栏目中的所有页面均系自动生成，自动分类排列，采用联索网络信息采集、网页信息提取、语义计算等智能搜索技术。内容源于公开的媒体报道，包括但不限于新闻网站、电子报刊、行业门户、客户网站等。使用本栏目前必读