中国人口众多,疾病谱系广,临床医生把握丰富的临床经验和样本资源。然而,如何将现有的经验、数据转化为证据,发表高质量 SCI 论文?大数据时代的到来,临床数据方式多样,对于临床工作者来说是机遇更是挑战。很显然,临床数据处理与统计剖析是一个困局!强大的数据挖掘技术能够化腐朽为神奇?那么,这个课程你一定不能错过!
这门课程主要讲哪些?
本课程提炼高质量临床研究论文中统计及研究思路的共性,总结出临床数据处理的标准化套路;网罗主流刊物中应用数据挖掘模型的案例,结合国外一些诊所临床研究课题的实例剖析,应用「傻瓜机式」的数据挖掘软件,全面论述临床数据挖掘的剖析思路与软件操作。
临床常见的医学研究设计标准化流程是哪些?
使用数据挖掘模型剖析临床数据的必要性?
临床研究中常见数据挖掘模型的原理与应用?
分析常用的开源数据挖掘机,手把手告诉您数据挖掘技术哪家强?!
本课程可帮助临床研究者建立剖析思路、深挖数据信息、准确作出科学论断,摆脱因为统计学和软件操作方面的不足带来的禁锢,通过实用的数据挖掘软件操作,从繁杂的数据整理、复杂的统计以及编程的工作中解脱下来,集中精力确切、深入、全面挖掘临床数据信息,提高科研论文的数目和质量。
课程安排
理论篇(第一天,5 月 28 号)
1. 使用数据挖掘技术处理临床数据的必要性
临床研究数据(队列/横断面研究)的传统流程化处理及其困局;
临床数据发展新特点:大样本、多变量、高度共线性、多维度(生理联通号、图片、基因芯片等)
数据挖掘剖析临床数据的优势:数据聚类、避免过拟合、变量筛选、增强预测价值、发现隐藏规律(高质量 SCI 论文案例剖析)
2. 数据挖掘基本概念,常见数据挖掘模型的原理与应用
基本概念:无监督/监督学习、分类、预测、关联、聚类、降维
常见模型与算法原理:线性回归, 岭回归/Lasso 回归, KNN, 决策树, 随机森林, 支持向量机;主成份剖析;聚类剖析等
3. 构建模型的评价与验证
基本概念:训练集、验证集,交叉验证
模型评价指标:成本曲线, ROC, precision, Score, C-index 等(发表的论文案例剖析)
操作篇(第一天,5 月 29 号)
1. 开源数据挖掘工具入门
基于 R/Python/Java 等(R 语言简介及入门)
Rattle,Weka,Scikit 等挖掘工具介绍
2. 基于 R 语言的数据挖掘工具 Rattle 的安装及操作
3. 使用 Rattle 处理临床数据(现场带学员进行操作)
变量转换、数据清除-初步关联分析、聚类分析
数据建模(常用数据挖掘模型,结合临床 SCI 论文实例)
模型验证(交叉验证等)
4. 使用 Rattle 演练真实临床数据(接受学员自带临床数据的评估、分析与后续指导)
讲师介绍
讲师一,中山大学附属第一医院心内科医学博士,近 3 年发表论文 20 余篇,第一/通讯作者 SCI 论文 14 篇(4 篇 IF>5),J Thorac Dis, Chinese J CancerRes 审稿人,主持和参与中国和市级课题 7 项,第 25 届长城国际心脏病学会议青年医师奖。
讲师二,中山大学孙逸仙纪念医院乳腺肿瘤医学部医学博士,发表 SCI 文章 23 篇,第一作者或通信作者17 篇,协作者 12 篇,总影响因子为 111.4。会议摘要获得日本 2011 年日本 AACR InternationalScholar-in-Training Grant,2015 年日本 KBCF Scholarship 奖金。主持国自然青年项目 1 项,广东省自然科学基金 1 项。
授课对象
医学硕/博士研究生、临床医学科研工作者、公共卫生与预防医学专业人员
原价 2500 元/人,5 月 18 号前报考交费,可享优惠价 2200 元,介绍别人报考,双方各返利 200 元
(提供正规收据,可出具大会邀请函)
联系人:庄大夫
电话:13760755035
email:zxd_medicine@163.com