恶性肿瘤监测数据的分析与利用

从数据收集到出版《年报》

👨‍⚕️陈琼,博士,副主任医师

🏥河南省癌症中心 河南省肿瘤医院

Thursday Apr 20, 2023

你是怎么写论文的?

  • 用R/SAS/STATA计算统计结果
  • 把结果粘贴到Word里做表格
  • 然后在Word里写论文



但是当你完成论文的撰写,突然发现原始数据有变化~



是不是感觉要崩溃了?

:sob:

  • 所有的统计工作和制表工作要重新来过!!!

可重复性研究报告/可重复性数据分析

是指利用代码把数据分析过程串起来,最终生成可重复性的报告。

  • R sweave
  • R markdown
  • Jupyter

这些都是实现可重复性报告的具体方式

Rmarkdown

Tip

Rmd格式文档通过把通用的markdown和嵌入的R语言代码块结合起来,通过knitr包把rmd文档编译成统一的md文档,然后再通过pandoc转成各种格式,如html、PDF、Word、slides等。

  • markdown负责报告文本
  • 嵌入的代码块负责统计分析过程
  • 完成的Rmd又knitr包转换为普通的md文档
  • 再通过pandoc把md渲染成我们需要报告

支持Rmarkdown的包遍地开花

  • 网站/博客
  • 书籍
  • 论文
  • 幻灯片
  • 语法不兼容
  • 学习成本高🤣

Quarto 上线

Quarto® is an open-source scientific and technical publishing system built on Pandoc

Rstudio把Quarto定义为“一个基于Pandoc的开源科学与技术出版系统。”

video slides

jldajlfkjalfdjlfdjlaj fjdklajflajflja

Slide Title

Slide Title

什么是文学编程?

什么事实爱啊

Animating content

# Fill in the spot we created for a plot
output$phonePlot <- renderPlot({
  # Render a barplot
})

# Fill in the spot we created for a plot
output$phonePlot <- renderPlot({
  # Render a barplot
  barplot(WorldPhones[,input$region]*1000, 
          main=input$region,
          ylab="Number of Telephones",
          xlab="Year")
})

从数据收集到出版《年报》