Research Question First

同样是公开数据,有的能发论文,有的只是浪费时间。

MedRoute 首页不先让你逛数据目录,也不先让你读内容,而是先接住你的研究问题。 你输入一句真正想做的医学题目,系统返回的不是一堆散链接,而是你现在最值得开始的那条公开数据路径。
把你的研究问题写进这里
当前为前端交互原型,下一步接真实 route-aware shortlist
别先找数据集,先判断哪条公开数据路径最值得做。
例如:我想研究老年抑郁与共病;我想复用 UK Biobank 做心血管风险; 我想知道 NHANES 能不能做肥胖与睡眠;我想用 TCGA / GEO 做肿瘤预后或免疫治疗反应。
输入一句真实研究问题,点击后更新右侧 route / shortlist / feasibility 预览。 支持点击下方示例快速填充
再看公开数据证据卡
当前已载入一个默认示例问题,你可以直接修改并刷新右侧预览。
首页第一任务 先帮研究者判断起点,而不是先展示仓库和目录。
论文证据墙的作用 证明公开数据真的能支撑高质量研究,不是让用户停下来逛内容。
真正的交付 不是更多链接,而是 `route + shortlist + feasibility + next action`。
What You Get

你最终拿到的,不是目录,而是决策结果。

首页必须明确承诺四个输出物。否则页面再好看,也只是一个方向不清的展示页。

Route
先识别你的问题更接近 cohort、survey、omics、EHR、registry 还是 evidence path。
Top 5
只返回最值得开始的 shortlist,而不是一长串搜索结果和站点链接。
Feasibility
明确 access friction、审批门槛、启动速度与 joinability。
Next
直接给下一步动作:先看哪个 codebook,先申请哪个库,还是直接进入 research-design。
Example Return

一个你真正会拿到的返回

Detected Route
Population Health + Cohort
示例问题:我想研究老年抑郁、睡眠和心血管共病的长期风险。
为什么会这样判断:关键词更接近老年、抑郁、睡眠、长期风险,因此优先走 cohort / survey 并存的路径。
1. UK Biobank 适合长期结局、暴露建模与多病共存问题,适合做高严肃度 cohort 路线。
approval required
2. NHANES 启动快,适合做全国代表性流调与交叉暴露问题,但随访深度有限。
open
3. CHARLS 更贴近老年人群与社会健康变量,但指标边界和国际可发表叙事要先评估。
mixed access
Next Action 先比较 UK Biobank 与 NHANES 的启动速度差异;如果你想今天就开始,先从 NHANES 变量表与设计权重入手。
Evidence Wall

这些公开数据,已经被写进了高影响医学论文。

这一屏不是让用户改去读论文,而是先建立一个判断:公开数据并不是练手素材,它确实能支撑高质量研究。 看完这些证据后,用户应该更愿意回到自己的研究问题,继续做数据路径选择。
BMJ IF 高影响 UK Biobank

多病共存与生活方式队列研究

这类论文最有说服力的地方,不在于数据量大,而在于它证明公开 cohort 可以支撑足够严肃的临床与公卫问题。

为什么值得参考:如果你的题目有清晰暴露、长期结局和亚组分析需求,这通常是一条高价值但需要审批的数据路径。
我也想做类似题 →
Nature IF 顶刊级 TCGA

公共癌症组学如何支撑机制与预后叙事

公开癌症组学最重要的信号不是“能下载”,而是它已经被用来支撑分型、机制、预后和转化医学叙事。

为什么值得参考:如果你正在做肿瘤预后、signature 或免疫治疗反应,TCGA / GEO 是需要优先评估的组学 route。
查看这条组学路径 →
JAMA Network Open IF 强临床 NHANES

全国代表性 survey 数据也能做出规范流调论文

NHANES 类型研究的意义在于提醒用户:公开 survey 并不是二流选择,它非常适合规范、可解释、启动快的流行病学问题。

为什么值得参考:如果你优先考虑今天就能开始,NHANES 往往比审批型 cohort 更适合作为第一步。
生成这类 shortlist →
The Lancet Digital Health IF 数字医学 MIMIC-IV

开放 ICU 记录支持风险预测与表型研究

这类卡的价值不是告诉用户 “MIMIC 很强”,而是明确它适合什么问题、有哪些门槛、什么时候值得投入时间。

为什么值得参考:如果你要做 ICU 风险预测或表型,MIMIC-IV 是高价值路径,但 credentialing 和时间事件处理是摩擦点。
先看 access friction →
Nature Medicine IF 顶级临床 UK Biobank

大规模 biobank 如何支撑风险分层与轨迹研究

这类论文会直接改变用户对公开数据的判断:没有自建队列,不代表做不了严肃临床问题,关键在于路线选得对不对。

为什么值得参考:适合要做 population-scale risk stratification、trajectory 或 multimorbidity 的研究者。
沿 cohort route 开始 →
Gut IF 高影响专科 GEO

转录组复用可以做 biomarker 与机制链条

GEO 的说服力在于:它不是把表达矩阵下载下来就结束,而是能够支撑 signature、验证链条和机制叙事。

为什么值得参考:如果你更偏向组学复用和快速起题,GEO 往往是比受控库更快的入口。
我想看快启动组学题 →
The Lancet Public Health IF 公卫顶级 DHS

标准化 household survey 能做国际比较与政策叙事

这类证据卡说明公开数据不只是单国分析,标准化 survey 还能支撑 LMIC、妇幼与可及性等更偏政策导向的问题。

为什么值得参考:如果你的研究问题天然适合跨国对比,DHS 是不能忽略的一条 route。
查看 cross-country route →
JCO IF 肿瘤高影响 SEER

Registry 规模数据支撑肿瘤结局与生存分析

Registry 路线的价值非常直接:分期、生存、亚组、时间趋势,这些都天然适合高可发表性的肿瘤结局问题。

为什么值得参考:如果你要做 population-level oncology,SEER 往往比散乱临床样本更稳定。
沿 registry route 判断 →
Nature Biotechnology IF 方法高影响 ClinicalTrials.gov

并不是所有高质量研究都从原始 patient-level data 开始

Trial registry 这类公开证据库提醒用户:evidence map、设计情报和 landscape analysis 也是正经发表路径,不必强行追求原始数据。

为什么值得参考:如果你现在更需要快速起题和设计判断,这条 route 的启动速度通常快于受控 patient-level 数据。
查看 evidence route →
Decision Bridge

看完这些证据,下一步不是继续逛,而是开始判断你的题该走哪条路径。

首页的作用到这里就结束了:它先让你相信公开数据值得做,然后把你送回真正的产品主链。 如果这一跳做不出来,再多证据卡也只是内容消费。

CTA A
我也想做类似题

从证据卡回到 route-aware shortlist,先判断这类问题最值得起步的 5 个数据源。

进入 shortlist 原型 →
CTA B
我更关心数据能不能拿

把“这篇论文做过什么”转换成“我今天能不能开始”,重点看 access friction、审批成本和 joinability。

先看 feasibility 结构 →
CTA C
我想直接继续起题

最自然的下游不是更多论文,而是把这条数据路径继续交给 `research-design` 去形成研究动作。

进入 next action 逻辑 →