农业生态园电商网站建设,网站改版 程序变了 原来的文章内容链接地址 打不开怎么办,wordpress sql server,在哪个网站上做推广作用好compareGroups
compareGroups 是一个功能强大的 R 包#xff0c;专为数据质量控制、数据探索和生成用于出版的单变量或双变量表格而设计。它能够创建各种格式的报表#xff0c;如纯文本、HTML、LaTeX、PDF、Word 或 Excel 格式#xff0c;并显示统计数据#xff08;均值、…compareGroups
compareGroups 是一个功能强大的 R 包专为数据质量控制、数据探索和生成用于出版的单变量或双变量表格而设计。它能够创建各种格式的报表如纯文本、HTML、LaTeX、PDF、Word 或 Excel 格式并显示统计数据均值、中位数、频率、发生率等。此外它还能生成可视化图表如箱线图、条形图、正态分布图等帮助快速理解数据分布。根据变量的性质正态、非正态或定性变量compareGroups 可以自动选择合适的统计检验如t检验、方差分析、Kruskal-Wallis检验、Fisher检验、log-rank检验等。它还支持基因数据的总结与分析显示单核苷酸多态性SNPs的等位基因频率并进行哈迪-温伯格平衡检验等常见的基因统计分析。
1、cGroupsGUI–基于tcltk工具的图形用户界面
描述
该函数允许用户通过图形界面以简单直观的方式构建表格并修改多个选项。
用法
cGroupsGUI(X) X: 一个矩阵或 data.frame。X 必须存在于 .GlobalEnv 中。
注意
如果通过 X 参数传递了 data.frame 或矩阵或通过 ‘加载数据’ GUI 菜单加载该对象此对象将被放置在 .GlobalEnv 中。当 GUI 界面打开时操作此 data.frame 或矩阵可能会导致 GUI 操作执行时出错。
示例
data(regicor)
cGroupsGUI(regicor)2、cGroupsWUI–基于 Shiny 工具的 Web 用户界面
描述
该函数使用基于 shiny 包的图形界面在 Web 浏览器中打开界面。
用法
cGroupsWUI(port 8102L) port: 整数类型与 runApp 的 port 参数相同。默认值为 8102L。如果启动 Web 浏览器时发生错误可以通过更改端口号来解决。
示例
require(compareGroups)
cGroupsWUI()3、compareGroups–按组描述性统计
描述
该函数执行按组的描述性统计适用于多个变量。根据这些变量的性质计算不同的描述性统计均值中位数频率或 K-M 概率并根据需要进行不同的统计检验t 检验ANOVAKruskal-WallisFisherlog-rank 等。
用法
compareGroups(formula, data, subset, na.action NULL, y NULL, Xext NULL, selec NA, method 1, timemax NA, alpha 0.05, min.dis 5, max.ylev 5, max.xlev 10, include.label TRUE, Q1 0.25, Q3 0.75, simplify TRUE, ref 1, ref.no NA, fact.ratio 1, ref.y 1, p.corrected TRUE, compute.ratio TRUE, include.miss FALSE, oddsratio.method midp, chisq.test.perm FALSE, byrow FALSE, chisq.test.B 2000, chisq.test.seed NULL, Date.format d-mon-Y, var.equal TRUE, conf.level 0.95, survFALSE, riskratio FALSE, riskratio.method wald, compute.prop FALSE, lab.missing Missing, p.trend.method spearman)formula: 一个公式类的对象或可以被转换为该类的对象。~ 的右侧必须以加法方式包含项左侧必须包含分组变量的名称。如果留空则计算整个样本的描述性统计而不进行测试。 data: 一个可选的数据框、列表或环境或可以被 as.data.frame 转换为数据框的对象包含模型中的变量。如果在 data 中找不到这些变量则从 environment(formula) 中提取。 subset: 一个可选的向量指定用于计算过程的个体子集。它应用于所有行变量。subset 和 selec 在每个行变量上以 的方式结合应用。 na.action: 一个函数指示当数据中包含缺失值时应采取的操作。默认值为 NULL相当于 na.pass这意味着不采取任何操作。na.exclude 对于希望在任何变量中移除所有缺失值的情况很有用。 y: 一个向量变量用于区分分组。它必须是数字、字符、因子或 NULL。默认值为 NULL表示计算整个样本的描述性统计而不进行测试。 Xext: 一个数据框或矩阵包含与 X 相同的行/个体但可能具有不同的变量/列。此参数用于 compareGroups.default以便在 Xext 和/或 .GlobalEnv 中搜索在 selec 参数中指定的变量。如果 Xext 为 NULL则从 X 加上 y 的变量创建 Xext。默认值为 NULL。 selec: 一个与行变量数量相同的列表。如果列表长度为 1则对所有行变量进行回收。selec 的每个组件是一个表达式将被评估以选择要分析的个体。否则命名列表指定应用于 selec 行变量。如果没有定义 .else 变量则对其余变量应用默认值。默认值为 NA所有个体都会被分析不进行子集。 method: 一个整数向量具有与行变量数量相同的组件。如果其长度为 1则对所有行变量进行回收。它仅适用于连续行变量对于因子行变量将被忽略。可能的值是 1强制分析为正态分布2强制分析为连续非正态3强制分析为分类4NA执行 Shapiro-Wilk 检验以决定正态或非正态。 否则命名向量指定应用于 method 行变量。如果没有定义 .else 变量则对其余变量应用默认值。默认值为 1。 timemax: 一个双精度向量具有与行变量数量相同的组件。如果其长度为 1则对所有行变量进行回收。它仅适用于 Surv 类行变量对于所有其他行变量将被忽略。该值指示在何时计算 K-M 概率。否则命名向量指定应用于 timemax 行变量。如果没有定义 .else 变量则对其余变量应用默认值。默认值为 NAK-M 概率在观察到的时间的中位数时计算。 alpha: 介于 0 和 1 之间的双精度值。Shapiro-Wilk 正态性检验的显著性阈值适用于连续行变量。默认值为 0.05。 min.dis: 一个整数。如果非因子行变量包含少于 min.dis 个不同值并且 method 参数设置为 NA则将其转换为因子。默认值为 5。 max.ylev: 一个整数表示分组变量y的最大水平数量。如果 y 包含超过 max.ylev 的水平则函数 compareGroups 会产生错误。默认值为 5。 max.xlev: 一个整数表示行变量作为因子时的最大水平数量。如果行变量是因子或转换为因子例如字符并且包含超过 max.xlev 的水平则会从分析中移除该变量并打印警告。默认值为 10。 include.label: 逻辑值指示结果中是否显示变量标签。默认值为 TRUE。 Q1: 一个双精度值介于 0 和 1 之间指示要在双变量表中显示的第一个数字的分位数。要计算最小值只需输入 0。默认值为 0.25表示第一个四分位数。 Q3: 一个双精度值介于 0 和 1 之间指示要在双变量表中显示的第二个数字的分位数。要计算最大值只需输入 1。默认值为 0.75表示第三个四分位数。 simplify: 逻辑值指示是否在分组变量和行变量中删除没有值的水平。默认值为 TRUE。 ref: 一个整数向量具有与行变量数量相同的组件。如果其长度为 1则对所有行变量进行回收。它仅适用于分类行变量。或者命名向量指定应用于 ref 的行变量一个保留名称是 .else定义其余变量的参考类别如果没有定义 .else 变量则对其余变量应用默认值。默认值为 1。 ref.no: 一个字符指定作为 Odds Ratio 或 Hazard Ratio 的参考水平的名称。此名称不区分大小写。特别适用于是/否变量。默认值为 NA表示 ref 指定的类别作为参考。 fact.ratio: 一个双精度向量具有与行变量数量相同的组件指示 HR/OR 的单位注意这不影响描述性统计。如果其长度为 1则对所有行变量进行回收。否则命名向量指定应用于 fact.ratio 的行变量。.else 是一个保留名称定义其余变量的参考类别如果没有定义 .else 变量则对其余变量应用默认值。默认值为 1。 ref.y: 一个整数指示 y 变量的参考类别用于计算 OR当 y 是二元因子时。默认值为 1。 p.corrected: 逻辑值指示是否必须校正成对比较的 p 值。这仅适用于具有超过 2 个类别的分组变量。默认值为 TRUE。 compute.ratio: 逻辑值指示是否必须计算 Odds Ratio对于二元响应或 Hazard Ratio对于时间事件响应。默认值为 TRUE。 include.miss: 逻辑值指示是否将缺失值视为分类变量的新类别。默认值为 FALSE。 oddsratio.method: 指定计算 Odds Ratio 的方法。参见 oddsratio 参数来自 epitools 包。默认值为 “midp”。 byrow: 逻辑值或 NA。应按行TRUE、列FALSE还是按行和列总结为 1NA报告分类变量的百分比。默认值为 FALSE表示按列报告百分比在组内。 chisq.test.perm: 逻辑值。它应用排列卡方检验chisq.test而不是精确的 Fisher 检验fisher.test。这仅适用于某些单元的预期计数低于 5 的情况。 chisq.test.B: 整数。在计算排列卡方检验时的次数。默认值为 2000。 chisq.test.seed: 整数或 NULL。进行排列卡方检验的种子。默认值为 NULL这表示不设置种子。必须输入与 NULL 不同的数字以便在执行排列卡方检验时重现结果。 date.format: 字符指示日期的显示方式。默认值为 “d-mon-Y”。有关更多信息请参见 chron。 var.equal: 逻辑值指示在比较均值时是否考虑相等方差适用于正态分布变量的多个组。如果为 TRUE则应用 anova 函数否则应用 oneway.test。默认值为 TRUE。 conf.level: 双精度值表示均值、中位数、比例或发生率以及危险、赔率和风险比的置信区间的置信水平。默认值为 0.95。 surv: 逻辑值。计算生存TRUE还是发生率FALSE适用于时间事件行变量。默认值为 FALSE。 riskratio: 逻辑值。计算 Odds RatioFALSE还是风险比TRUE。默认值为 FALSE。 riskratio.method: 指定计算 Odds Ratio 的方法。参见 riskratio 参数来自 epitools 包。默认值为 “wald”。 compute.prop: 逻辑值。计算比例TRUE还是百分比FALSE适用于分类行变量。默认值为 FALSE。 lab.missing: 字符。缺失类别的标签。仅在 include.missing TRUE 时适用。默认值为 “Missing”。 p.trend.method: 字符指示用于趋势 p 值的测试名称。它仅适用于数值非正态变量。可能的值为 “spearman”、“kendall” 或 “cuzick”。默认值为 “spearman”。
详细信息
根据行变量被视为连续正态分布1、连续非正态分布2或分类变量3执行以下描述性统计和检验
正态分布计算均值、标准差并进行 t 检验或 ANOVA。非正态分布计算中位数、第 1 和第 3 四分位数默认并进行 Kruskal-Wallis 检验。分类变量计算绝对频率和相对频率并在某些单元格的期望频率小于 5 时进行卡方检验或精确 Fisher 检验。
此外行变量可以是 Surv 类。此时计算在固定时间通过 timemax 参数设置下的事件概率并进行 logrank 检验。
当组数超过 2 时还会执行成对比较调整多重检验当行变量为正态分布时使用 Tukey 方法否则使用 Benjamini Hochberg 方法并计算趋势的 p 值。对于正态分布的行变量趋势的 p 值通过 Pearson 检验计算对于连续非正态分布的变量使用 Spearman 检验计算趋势的 p 值。此外对于连续非正态分布的变量可以使用 Kendall 检验methodkendall 来自 cor.test或 Cuzick 检验cuzickTest计算趋势的 p 值。如果行变量为 Surv 类则从 Cox 模型中计算得分检验其中分组变量作为整数变量预测因子引入。如果行变量为分类变量则通过 Mantel-Haenszel 趋势检验计算趋势的 p 值。
如果有两个组将为每个行变量计算 Odds Ratio 或 Risk Ratio。而如果响应是 Surv 类即时间到事件则计算 Hazard Ratios。当 x 变量为因子时使用 epitools 包中的 oddsratio 和 riskratio 分别计算 Odds Ratio 和 Risk Ratio。当 x 变量为连续变量时在具有典型链接和对数链接的逻辑回归下计算 Odds Ratio 和 Risk Ratio。对于 Hazard Ratios 的 p 值在行变量为分类或连续时分别通过 logrank 检验或 Wald 检验计算。
示例
require(compareGroups)
require(survival)# 加载 REGICOR 数据
data(regicor)# 计算心血管事件的时间变量
regicor$tcv - with(regicor, Surv(tocv, as.integer(cvYes)))
attr(regicor$tcv,label)-Cardiovascular# 计算总体死亡时间变量
regicor$tdeath - with(regicor, Surv(todeath, as.integer(deathYes)))
attr(regicor$tdeath,label) - Mortality# 按性别计算描述性统计
res - compareGroups(sex ~ .-id-tocv-cv-todeath-death, data regicor)
summary(res)# 单变量绘图
## plot(res)# 性别分层的所有行变量的绘图
## plot(res, bivar TRUE)# 更新响应变量为心血管事件的时间
## update(res, tcv ~ . sex- tdeath- tcv)
4、compareSNPs–按组描述遗传统计数据
描述
该函数提供了您 SNP 数据的广泛摘要范围使您能够对基因分型结果进行深入的质量控制并在分析之前探索数据。摘要指标包括等位基因和基因型频率及计数、缺失率、哈迪-温伯格平衡等可以在整个数据集或按其他变量如病例对照状态进行分层。它还可以测试组间缺失率的差异。
用法
compareSNPs(formula, data, subset, na.action NULL, sep , verbose FALSE, ...)formula: 一个公式类对象或可以转换为该类的对象。~ 的右侧必须以加法方式包含项这些项必须引用 data 中的变量并且必须是字符或因子类其级别是以其水平写出的基因型例如A/A、A/T 和 T/T。~ 的左侧必须包含分组变量的名称或者可以留空在这种情况下将为整个样本提供摘要数据并且不进行缺失性检验。 data: 一个可选的数据框、列表或环境或可以通过 as.data.frame 转换为数据框的对象包含模型中的变量。如果在 data 中找不到它们则从 environment(formula) 中获取变量。 subset: 一个可选的向量指定用于计算过程的个体子集适用于所有遗传变量。 na.action: 一个指示数据中包含 NAs 时应采取何种措施的函数。默认值为 NULL相当于 na.pass意味着不采取任何措施。na.exclude 对于希望删除任何变量中有缺失值的所有个体时可能会很有用。 sep: 字符串指示等位基因之间的分隔符例如当使用 A/A、A/T 和 T/T 基因型编码时sep 应设置为 /。默认值为 “”表示基因型编码为 AA、AT 和 TT。 verbose: 逻辑值打印 HWChisq 函数的结果。默认值为 FALSE。 …: 目前被忽略的参数。
示例
require(compareGroups)# load example data
data(SNPs)# visualize first rows
head(SNPs)# select casco and all SNPs
myDat - SNPs[,c(2,6:40)]# QC of three SNPs by groups of cases and controls
res-compareSNPs(casco ~ .-casco, myDat)
res# QC of three SNPs of the whole data set
res-compareSNPs( ~ .-casco, myDat)
res
5、createTable–分组描述表:二元表
描述
这个函数用分组的描述构建一个紧凑和漂亮的表。
用法
createTable(x, hide NA, digits NA, type NA, show.p.overall TRUE,show.all, show.p.trend, show.p.mul FALSE, show.n, show.ratio FALSE, show.descr TRUE, show.ci FALSE, hide.no NA, digits.ratio NA,show.p.ratio show.ratio, digits.p 3, sd.type 1, q.type c(1, 1),extra.labels NA, all.last FALSE, lab.ref Ref., stars FALSE)
参数 x: 一个 “compareGroups” 类对象。 hide: 一个向量或列表包含与行变量数量相同的整数或字符。如果其长度为 1则对所有行变量进行回收。每个组件指定必须隐藏且不显示的类别如果是字符则为类别的文字名称如果是整数则为位置。此参数仅适用于分类行变量对于连续行变量将被忽略。如果为 NA则显示所有类别。或者是一个命名向量或命名列表指定应用于哪些行变量的 ‘hide’其余行变量应用默认值。默认值为 NA。 digits: 一个整数向量其组件数量与行变量相同。如果其长度为 1则对所有行变量进行回收。每个组件指定要显示的有效小数位数。或者是一个命名向量指定 ‘digits’ 应用于哪些行变量一个保留名称是 ‘.else’定义其余变量的 ‘digits’如果没有定义 ‘.else’ 变量则对其余变量应用默认值。默认值为 NA表示使用适当的小数位数详细信息请参见说明文档。 type: 一个整数指示是否显示绝对和/或相对频率1 - 仅相对频率2 或 NA - 绝对和相对频率以括号显示3 - 仅绝对频率。 show.p.overall: 逻辑值指示是否显示整体组显著性‘p.overall’ 列的 p 值。默认值为 TRUE。 show.all: 逻辑值指示是否显示 ‘[ALL]’ 列未按组分层的所有数据。如果定义了分组变量则默认值为 FALSE如果没有组则为 FALSE。 show.p.trend: 逻辑值指示是否显示 p-trend。如果组少于 3则始终为 FALSE。如果缺少此参数且组数超过 2 且分组变量为有序因子则显示 p-trend。默认情况下p-trend 不显示当组数超过 2 且分组变量为有序因子类时显示。 show.p.mul: 逻辑值指示是否显示成对组间比较的 p 值。组数少于 3 时始终为 FALSE。默认值为 FALSE。 show.n: 逻辑值指示是否在 ‘descr’ 表中显示每个行变量分析的个体数量。默认值为 FALSE当没有组时为 TRUE。 show.ratio: 逻辑值指示是否显示 OR / HR。默认值为 FALSE。 show.descr: 逻辑值指示是否显示描述性统计即均值、比例等。默认值为 TRUE。 show.ci: 逻辑值指示是否显示均值、中位数、比例或发生率的置信区间。如果是则显示在方括号之间。默认值为 FALSE。 hide.no: 字符指定要隐藏的名称级别适用于所有具有 2 个类别的分类变量。大小写不敏感。结果是该变量只显示名称而不显示类别。这对是/否变量尤其有用。对于 ‘hide’ 参数不同于 NA 的分类行变量将被忽略。默认值为 NA表示不隐藏任何类别。 digits.ratio: 与 ‘digits’ 参数相同但适用于风险比或赔率比。 show.p.ratio: 逻辑值指示是否显示与每个风险比/赔率比对应的 p 值。 digits.p: 整数指示所有 p 值显示的小数位数。默认值为 3。 sd.type: 一个整数指示标准偏差的显示方式1 - 均值SD2 - 均值 ± SD。 q.type: 一个包含两个整数的向量。第一个组件指非正态行变量显示的括号类型1 - 方形2 - 圆形第二个组件指百分位数分隔符1 - ‘;’2 - ‘’3 - ‘-’。默认值为 c(1, 1)。 extra.labels: 字符向量包含 4 个组件对应于附加到正常、非正态、分类或生存行变量标签的关键标签。默认值为 NA不附加任何额外关键字。如果设置为 c(“”,“”,“”,“”)则附加Mean (SD)、“Median [25th; 75th]”、“N (%)” 和 “Incidence at timetimemax”请参阅 compareGroups 函数中的 timemax 参数。 all.last: 逻辑值。整个样本的描述性统计放在按组描述性统计之后。默认值为 FALSE表示整体队列的描述性统计放在第一位。 lab.ref: 字符。参考类别的显示字符串。默认值为 “Ref.”。 stars: 逻辑值指示是否在 p 值旁边附加星号‘**’p 值 0.05‘*’ 0.05 p 值 0.1“” p 值 0.1。默认值为 FALSE。 which.table: 字符指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’允许部分匹配分别打印按组描述性统计表、可用数据表或两个表。默认值为 ‘descr’。 nmax: 逻辑值指示是否显示所有行变量中至少具有一个有效值的主题数量。默认值为 TRUE。 nmax.method: 整数有两个可能的值1 - 在至少一个行变量中具有有效值的观察数量2 - 数据集或组中的总观察数量或行数。默认值为 1。 header.labels: 一个命名字符向量包含 ‘all’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’ 组件指示 ‘[ALL]’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’可用数据的标签。默认值为零长度向量不做更改即 ‘[ALL]’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’ 标签显示在整个队列的描述性统计、全局 p 值、趋势的 p 值、HR/OR 和每个 HR/OR 的 p 值以及可用数据中。 …: 传递给 print.default 的其他参数。
示例
# 加载所需的包
require(compareGroups)
require(survival)# 加载 REGICOR 数据
data(regicor)# 计算心血管事件的时间变量
regicor$tcv - with(regicor, Surv(tocv, as.integer(cv Yes)))
attr(regicor$tcv, label) - Cardiovascular incidence# 根据心血管事件的时间计算描述性统计以 no 类别作为参考来计算 HR。
res - compareGroups(tcv ~ age sex smoker sbp histhtn chol txchol bmi phyact pcs tcv, regicor, ref.no no)# 构建显示 HR 的表格并隐藏 no 类别
restab - createTable(res, show.ratio TRUE, hide.no no)
restab # 打印可用信息表# 进行总结
summary(restab) # 更多...## 不运行的代码
# 添加 可用数据 列
update(restab, show.n TRUE)# 整个队列的描述性统计
update(restab, x update(res, ~ .))# 将响应变量更改为性别
# 显示比值比OR而不是风险比HR。
# 请注意现在可以计算按死亡时间或心血管事件时间的描述性统计但不能计算 OR。
# 将 timemax 设置为 5 年以报告 5 年的死亡概率和心血管事件概率
update(restab, x update(res, sex ~ . - sex tdeath tcv, timemax 5 * 365.25))## 组合表格
# a) 按行将前四个变量作为一组其余变量作为另一组
rbind(First group of variables restab[1:4], Second group of variables restab[5:length(res)])# b) 按列将按性别分层的表格并排放置
res1 - compareGroups(year ~ . - id - sex, regicor)
restab1 - createTable(res1, hide.no no)
restab2 - update(restab1, x update(res1, subset sex Male))
6、createTable–执行描述并构建二元表
描述
这个函数一步构建一个双变量表调用compareGroups和createTable函数。
用法
descrTable(formula,data,subset,na.action NULL,y NULL,Xext NULL,selec NA,method 1,timemax NA,alpha 0.05,min.dis 5,max.ylev 5,max.xlev 10,include.label TRUE,Q1 0.25,Q3 0.75,simplify TRUE,ref 1,ref.no NA,fact.ratio 1,ref.y 1,p.corrected TRUE,compute.ratio TRUE,include.miss FALSE,oddsratio.method midp,chisq.test.perm FALSE,byrow FALSE,chisq.test.B 2000,chisq.test.seed NULL,Date.format d-mon-Y,var.equal TRUE,conf.level 0.95,surv FALSE,riskratio FALSE,riskratio.method wald,compute.prop FALSE,lab.missing Missing,p.trend.method spearman,hide NA,digits NA,type NA,show.p.overall TRUE,show.all,show.p.trend,show.p.mul FALSE,show.n,show.ratio FALSE,show.descr TRUE,show.ci FALSE,hide.no NA,digits.ratio NA,show.p.ratio show.ratio,digits.p 3,sd.type 1,q.type c(1, 1),extra.labels NA,all.last FALSE,lab.ref Ref.,stars FALSE
)
…: 参数均同 compareGroups 和 createTabel。
示例
require(compareGroups) # load REGICOR data
data(regicor) # perform descriptives by year and build the table.
# note the use of arguments from compareGroups (formula and data set) and
# arguments from createTable (hide.no and show.p.mul)
descrTable(year ~ ., regicor, hide.nono, show.p.mulTRUE)7、export2csv–将描述表导出为纯文本(CSV)格式
描述
该函数接受createTable的结果并将表导出为纯文本(CSV)格式。
用法
export2csv(x, file, which.tabledescr, sep,, nmax TRUE, nmax.method 1, header.labels c(), ...)x: 一个 ‘createTable’ 类的对象。 file: 将以 CSV 格式写入的文件。此外还会写入一个扩展名为 ‘_appendix’ 的文件其中包含可用数据表。 which.table: 字符指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’允许部分匹配分别导出按组的描述性统计表、可用数据表或两个表。默认值为 ‘descr’。 sep: 字符。变量分隔符与 write.table 的 sep 参数相同。默认值为 ‘,’。 nmax: 逻辑值指示是否显示在所有行变量中至少有一个有效值的受试者数量。默认值为 TRUE。 nmax.method: 整数具有两个可能的值1- 在至少一个行变量中具有有效值的观察数量2- 数据集或组中的观察总数或行数。默认值为 1。 header.labels: 参见 createTable 的 header.labels 参数。 …: 其他传递给 write.table 的参数。
示例
require(compareGroups)
data(regicor)
res - compareGroups(sex ~.-id-todeath-death-tocv-cv, regicor)
export2csv(createTable(res, hide.no n), filetempfile(fileext.csv))8、export2html–导出描述表为HTML格式
描述
该函数接受createTable的结果并将表导出为HTML格式。
用法
export2html(x, file, which.tabledescr, nmax TRUE, nmax.method 1, header.labels c(), ...)x: 一个 ‘createTable’ 类的对象。 file: 将以 HTML 格式写入的文件。此外还会写入一个扩展名为 ‘_appendix’ 的文件其中包含可用数据表。如果缺失将返回 HTML 代码。 which.table: 字符指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’允许部分匹配分别导出按组的描述性统计表、可用数据表或两个表。默认值为 ‘descr’。 nmax: 逻辑值指示是否显示在所有行变量中至少有一个有效值的受试者数量。默认值为 TRUE。 nmax.method: 整数具有两个可能的值1- 在至少一个行变量中具有有效值的观察数量2- 数据集或组中的观察总数或行数。默认值为 1。 header.labels: 参见 createTable 的 header.labels 参数。 …: 当前被忽略的其他参数。
示例
require(compareGroups)
data(regicor)
res - compareGroups(sex ~.-id-todeath-death-tocv-cv, regicor)
export2html(createTable(res, hide.no n), filetempfile(fileext.html))9、export2latex–导出描述表为LaTeX格式
描述
这个函数接受createTable的结果并将表导出为LaTeX格式。
用法
export2latex(x, ...)
## S3 method for class createTable
export2latex(x, file, which.table descr, size same, nmax TRUE, nmax.method 1, header.labels c(), caption NULL, loc.caption top, label NULL, landscape NA, colmax 10, ...)
## S3 method for class cbind.createTable
export2latex(x, file, which.table descr, size same, nmax TRUE, nmax.method 1, header.labels c(), caption NULL, loc.caption top, label NULL, landscape NA, colmax 10, ...)x: 一个 ‘createTable’ 类的对象。 file: 要保存结果代码的文件名称。如果文件缺失则输出将在屏幕上显示。此外还会写入一个扩展名为 ‘_appendix’ 的文件其中包含可用数据表。 which.table: 字符指示导出哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’允许部分匹配分别导出按组的描述性统计表、可用数据表或两个表。默认值为 ‘descr’。 size: 字符指示表元素的大小。可能的值有‘tiny’、‘scriptsize’、‘footnotesize’、‘small’、‘normalsize’、‘large’、‘Large’、‘LARGE’、‘huge’、‘Huge’ 或 ‘same’允许部分匹配。默认值为 ‘same’表示表的字体大小与主 LaTeX 文档中指定的相同。 nmax: 逻辑值指示是否显示在所有行变量中至少有一个有效值的受试者数量。默认值为 TRUE。 nmax.method: 整数具有两个可能的值1- 在至少一个行变量中具有有效值的观察数量2- 数据集或组中的观察总数或行数。默认值为 1。 header.labels: 参见 createTable 的 header.labels 参数。 caption: 字符指定描述性统计和可用数据表的标题。如果 which.tableboth则 caption 的第一个元素将分配给描述性表第二个元素分配给可用数据表。如果设置为 “”则不插入标题。默认值为 NULL将为描述性表写入 Summary descriptives table by groups of ‘y’为可用数据表写入 Available data by groups of ‘y’。 label: 字符指定描述性统计和可用数据表的标签。这在 LaTeX 文档的其他地方引用表格时可能很有用。如果 which.tableboth则 label 的第一个元素将分配给描述性表第二个元素分配给可用数据表。默认值为 NULL不会为表格分配标签。 loc.caption: 字符指定表格标题的位置。可能的值为 ‘top’ 或 ‘bottom’允许部分匹配。默认值为 ‘top’。 landscape: 逻辑值指示表格是否应放置为横向或者 NA当列数超过 ‘colmax’ 时将表格放置为横向。默认值为 NA。 colmax: 整数指示最大列数以便表格不放置为横向。此参数仅在 ‘landscape’ 参数为 NA 时适用。默认值为 10。 …: 当前被忽略的其他参数。
示例
require(compareGroups)
data(regicor)
res - compareGroups(sex ~.-id-todeath-death-tocv-cv, regicor)
export2latex(createTable(res, hide.no n), filetempfile(fileext.tex))10、export2md–导出描述表为Markdown格式
描述
该函数接受createTable的结果并将表导出为markdown格式。当在Markdown文件(. rmd)中插入R代码块时它可能很有用。
用法
export2md(x, which.table descr, nmax TRUE, nmax.method 1, header.labels c(), caption NULL, format html, width Inf, strip FALSE, first.strip FALSE, background #D2D2D2, size NULL, landscapeFALSE, header.backgroundNULL, header.colorNULL, positioncenter, ...)x: 一个 ‘createTable’ 类的对象。 which.table: 字符指示打印哪个表。可能的值为 ‘descr’ 或 ‘avail’允许部分匹配分别导出按组的描述性统计表或可用数据表。默认值为 ‘descr’。 nmax: 逻辑值指示是否显示在所有行变量中至少有一个有效值的受试者数量。默认值为 TRUE。 nmax.method: 整数具有两个可能的值1- 在至少一个行变量中具有有效值的观察数量2- 数据集或组中的观察总数或行数。默认值为 1。 header.labels: 参见 createTable 的 header.labels 参数。 caption: 字符指定描述性统计和可用数据表的标题。如果 which.tableboth则 caption 的第一个元素将分配给描述性表第二个元素分配给可用数据表。如果设置为 “”则不插入标题。默认值为 NULL将为描述性表写入 Summary descriptives table by groups of ‘y’为可用数据表写入 Available data by groups of ‘y’。 export2md: 字符具有三个选项‘html’、‘latex’ 或 ‘markdown’。如果缺失它会尝试猜测插入表的 Rmarkdown 文件的默认选项或者如果不在 Rmarkdown 文件中或格式未指定则为 html。 width: 字符串指定描述性表第一列的宽度。导出到 Word 时会被忽略。默认值为 Inf这使得第一列自动调整为变量名称。其他示例有 ‘10cm’、‘3in’ 或 ‘30em’。 strip: 逻辑值。它阴影每个变量对应的表线。 first.strip: 逻辑值。它确定是阴影第一个变量TRUE还是第二个变量FALSE。它仅在 strip 参数为 true 时适用。 background: 颜色代码以 HEX 格式表示阴影线的颜色。您可以使用 rgb 函数将红色、绿色和蓝色转换为 HEX 代码。默认颜色为 ‘#D2D2D2’。 size: 数字。描述性表的大小。默认值为 NULL这会创建默认大小的表。 landscape: 逻辑值。它确定是否将表格放置为横向水平格式。它仅在格式为 ‘latex’ 时适用。默认值为 FALSE。 header.background: 字符用于表头的颜色或 ‘NULL’。默认值为 ‘NULL’。 header.color: 表头文本的颜色。默认颜色为 ‘NULL’。 position: 字符指定表格位置。可能的值为 ‘left’、‘center’、‘right’、‘float_left’ 和 ‘float_right’。它仅在编译为 HTML 或 PDF 时适用。默认值为 ‘center’。有关更多信息请参见 kable_styling 的 position 参数。 …: 传递给 kable 的其他参数。
示例
---
title: Report
output: html_document: default
---
{r setup, includeFALSE}
knitr::opts_chunk$set(echo FALSE, warningFALSE, messageFALSE)
{r}
library(compareGroups)
data(regicor)
res - compareGroups(year~., regicor)
restab - createTable(res) ## Report section
The following table contains descriptives of **REGICOR** data {r}
export2md(restab, strip TRUE, first.strip TRUE) 11、export2pdf–将表格导出为PDF文件
描述
这个函数会自动创建一个带有表格的PDF。另外LaTeX代码存储在指定的文件中。
用法
export2pdf(x, file, which.tabledescr, nmaxTRUE, header.labelsc(), captionNULL, widthInf, stripFALSE, first.stripFALSE, background#D2D2D2, sizeNULL, landscapeFALSE, numcompiled2, header.backgroundNULL, header.colorNULL)x: 一个 ‘createTable’ 类的对象或其子类。 file: 字符指定编译 LaTeX 代码后生成的 PDF 文件。相应的 LaTeX 代码也会保存在同一文件夹中并以 .tex 扩展名存储。当 ‘compile’ 参数为 FALSE 时仅保存 .tex 文件。 which.table: 字符指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’允许部分匹配分别打印按组的描述性统计表、可用数据表或两个表。默认值为 ‘descr’。 nmax: 逻辑指示是否显示至少在一个行变量中具有有效值的受试者数量。默认值为 TRUE。 header.labels: 一个字符命名向量包含 ‘all’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’ 组件指示标签分别为 ‘[ALL]’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’可用数据。默认值为零长度向量这意味着不做任何更改。 caption: 字符指定描述性和可用数据表的标题。如果 which.table‘both’则 ‘caption’ 的第一个元素将分配给描述性表第二个元素分配给可用数据表。如果设置为 “”则不插入标题。默认值为 NULL。 width: 字符串指定描述性表第一列的宽度。默认值为 Inf意味着第一列自动调整到变量名称。其他示例包括 ‘10cm’、‘3in’ 或 ‘30em’。 strip: 逻辑。它影藏每个变量对应的表格线。 first.strip: 逻辑。它确定是否影藏第一个变量TRUE或第二个变量FALSE。仅在 strip 参数为真时适用。 background: HEX 格式的颜色代码用于阴影线。默认颜色为 ‘#D2D2D2’。 size: 数字。描述性表的大小。默认值为 NULL表示以默认大小创建表。 landscape: 逻辑。它决定是否以横向格式放置表格。仅在格式为 ‘latex’ 时适用。默认值为 FALSE。 numcompiled: 整数。LaTeX 代码编译的次数。默认编译两次。 header.background: 表头的颜色字符或 ‘NULL’。默认值为 ‘NULL’。 header.color: 表头文本的颜色字符。默认颜色为 ‘NULL’。
示例
require(compareGroups)
data(regicor)
# example on an ordinary table
res - createTable(compareGroups(year ~ . -id, regicor), hide c(sex1), hide.no no)
export2pdf(res, filetempfile(fileext.pdf), sizesmall)
12、export2word–将表格导出为WORD文件
描述
这个函数用表格自动创建一个Word文件。
用法
export2word(x, file, which.tabledescr, nmaxTRUE, header.labelsc(),captionNULL, stripFALSE, first.stripFALSE, background#D2D2D2,sizeNULL, header.backgroundNULL, header.colorNULL)x: 一个 ‘createTable’ 类的对象或其子类。 file: 字符指定编译相应的 Markdown 代码后生成的 Word 文件 (.doc 或 .docx)。 which.table: 字符指示打印哪个表。可能的值为 ‘descr’ 或 ‘avail’允许部分匹配分别导出按组的描述性统计表或可用数据表。默认值为 ‘descr’。 nmax: 逻辑指示是否显示至少在一个行变量中具有有效值的受试者数量。默认值为 TRUE。 header.labels: 参见 ‘createTable’ 的 ‘header.labels’ 参数。 caption: 字符指定描述性和可用数据表的标题。如果 which.table‘both’则 ‘caption’ 的第一个元素将分配给描述性表第二个元素分配给可用数据表。如果设置为 “”则不插入标题。默认值为 NULL。 strip: 逻辑。它影藏每个变量对应的表格线。 first.strip: 逻辑。它确定是否影藏第一个变量TRUE或第二个变量FALSE。仅在 strip 参数为真时适用。 background: HEX 格式的颜色代码用于阴影线。默认颜色为 ‘#D2D2D2’。 size: 数字。描述性表的大小。默认值为 NULL表示以默认大小创建表。 header.background: 表头的颜色字符或 ‘NULL’。默认值为 ‘NULL’。 header.color: 表头文本的颜色字符。默认颜色为 ‘NULL’。
示例
require(compareGroups)
data(regicor)# example on an ordinary table
res - createTable(compareGroups(year ~ . -id, regicor), hide c(sex1), hide.no no)
export2word(res, file tempfile(fileext.docx))
13、export2xls–将描述表导出为excel格式(.xlsx或.xls)
描述
该函数接受createTable的结果并将表导出为Excel格式(.xlsx或.xls)。
用法
export2xls(x, file, which.tabledescr, nmaxTRUE, nmax.method1, header.labelsc())x: 一个 ‘createTable’ 类的对象。 file: 文件指定将以 Excel 格式写入的表格。 which.table: 字符指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’允许部分匹配分别导出按组的描述性统计表、可用数据表或两个表格。在后者的情况下‘both’将生成两个工作表每个表对应一个。默认值为 ‘descr’。 nmax: 逻辑指示是否显示至少在一个行变量中具有有效值的受试者数量。默认值为 TRUE。 nmax.method: 整数有两个可能的值1-表示在至少一个行变量中具有有效值的观察数量2-数据集或组中的观察总数或行数。默认值为 1。 header.labels: 参见 ‘createTable’ 的 ‘header.labels’ 参数。
示例
require(compareGroups)
data(regicor)
res - compareGroups(sex ~. -id-todeath-death-tocv-cv, regicor)
export2xls(createTable(res, hide.no n), filetempfile(fileext.xlsx))14、getResults–轻松检索作为r对象(矩阵和向量)的汇总数据
描述
这个函数从一个compareGroups对象中提取特定的结果(描述、p值、比值/风险比等)作为矩阵或向量。
用法
getResults(obj, what descr)obj: 一个 ‘compareGroups’ 或 ‘createTable’ 类的对象。 what: 字符指示要检索的结果类型描述性统计、p 值、趋势 p 值、成对 p 值或比值比/风险比。可能的值为“descr”、“p.overall”、“p.trend”、“p.mul” 和 “ratio”。默认值为 “descr”。 what “descr”: 一个数组或矩阵列数等于变量/类别数量七列对应所有可能的描述性统计均值、标准差、中位数、Q1、Q3、绝对和相对频率。当分析不同组时数组的第三维对应组否则结果将是没有第三维的矩阵。 what “p.overall”: 一个向量其元素为每个分析变量的 p 值。 what “p.trend”: 一个向量其元素为每个分析变量的趋势 p 值。 what “p.mul”: 一个矩阵包含成对 p 值行对应分析变量列对应每对组。 what “ratio”: 一个矩阵行数等于变量/类别数量四列对应比值比/风险比、置信区间和 p 值。
示例
require(compareGroups)
data(regicor)
res-compareGroups(sex ~ . ,regicor,methodc(triglyc2))
# retrieve descriptives
getResults(res)
# retrieve OR and their corresponding p-values
getResults(res,whatratio)15、missingTable–失踪者分组统计表
描述
该函数返回一个表其中包含已构建的二元表中不可用的频率。
用法
missingTable(obj,...)obj: 一个 ‘compareGroups’ 或 ‘createTable’ 类的对象。 …: 传递给 createTable 的其它参数。
示例
require(compareGroups)
# load regicor data
data(regicor)
# table of descriptives by recruitment year
res - compareGroups(year ~ age sex smoker sbp histhtn
chol txchol bmi phyact pcs death, regicor)
restab - createTable(res, hide.no no)
# missingness table
missingTable(restab,type1)
## Not run:
# also create the missing table from a compareGroups object
miss - missingTable(res)
miss
# some methods that works for createTable objects also works for objects
# computed by missTable function.
miss[1:4]
varinfo(miss)
plot(miss)
#... but update methods cannot be applied (this returns an error).
update(miss,type2)
## End(Not run)16、padjustCompareGroups–根据多次比较更新p值
描述
给定一个compareGroups对象返回使用以下方法之一调整的p值(stats::p.adjust)
用法
padjustCompareGroups(object_compare, p p.overall, method BH)object_compare: 一个 ‘compareGroups’ 类的对象。 p: 字符串指定需要校正的 p 值。可能的值为 ‘p.overall’ 和 ‘p.trend’默认值为 ‘p.overall’。 method: 校正方法字符串。可以使用简写形式参见 p.adjust 函数。
示例
# Define simulated data
set.seed(123)
N_obs-100
N_vars-50
data-matrix(rnorm(N_obs*N_vars), N_obs, N_vars)
sim_data-data.frame(data,Yrbinom(N_obs,1,0.5))# Execute compareGroups
res-compareGroups(Y~.,datasim_data)
res# update p values
res_adjusted-padjustCompareGroups(res)
res_adjusted# update p values using FDR method
res_adjusted-padjustCompareGroups(res, method fdr)
res_adjusted17、printTable–“漂亮的”表格
描述
这个函数以“nice”格式在控制台上打印一个表。
用法
printTable(obj, row.names TRUE, justify right)obj: 一个 ‘data.frame’ 或 ‘matrix’ 类的对象。它必须至少包含两列第一列被视为 ‘row.names’ 并且左对齐如果 ‘row.names’ 参数设置为 TRUE而其余列右对齐。 row.names: 逻辑值指示第一列或变量是否作为 ‘row.names’ 列处理并且必须左对齐。默认值为 TRUE。 justify: 字符串类似于 format 函数的 ‘justify’ 参数。当 ‘row.names’ 参数为 FALSE 时应用于整个数据框或矩阵的所有列否则应用于除第一列之外的所有列。默认值为 ‘right’。
示例
require(compareGroups)
data(regicor)# example of the coefficients table from a linear regression
model - lm(chol ~ age sex bmi, regicor)
results - coef(summary(model))
results - cbind(Var rownames(results), round(results, 4))
printTable(results)# or visualize the first rows of the iris data frame.
# In this example, the first column is not treated as a row.names column and it is right justified.
printTable(head(iris), FALSE)# the same example with columns centered
printTable(head(iris), FALSE, centre)18、radiograph–列出数据集中的值
描述
此函数创建数据集中原始数据的报告。对于每个变量一个唯一条目的有序列表(作为字符串读取)用于检查输入错误。
用法
radiograph(file, header TRUE, saveFALSE, out.file, ...)file: 字符串指定数据集所在的文件。 header: 参见 read.table 的 header 参数。 save: 逻辑值指示输出是应存储在文件中 (TRUE) 还是打印在控制台上 (FALSE)。默认值为 FALSE。 out.file: 字符串指定结果要输出的文件。仅当 save 参数设置为 TRUE 时适用。 …: 传递给 read.table 的其他参数。
示例
## Not run:
require(compareGroups)
# read example data of regicor in plain text format with variables separated by \t.
datafile - system.file(exdata/regicor.txt, packagecompareGroups)
radiograph(datafile)
## End(Not run)19、regicor–REGICOR横断面数据
描述
这些数据来自西班牙西北部赫罗纳省REGICOR研究中对具有代表性的个人进行的3次不同的横断面调查。
用法
data(regicor)20、report–描述性表格和图的报告
描述
该函数自动创建一个PDF其中包含描述性表以及可用性数据和所有图。该文件的结构和索引方式使用户可以浏览文档中的所有表格和图形。
用法
report(x, file, fig.folder, compile TRUE, openfile FALSE, title Report,author, date, percFALSE, ...) x: 一个 ‘createTable’ 类的对象。 file: 字符串指定在编译 LaTeX 代码后生成的 PDF 文件。LaTeX 代码也存储在同一文件夹中扩展名为 .tex。如果 compile 参数为 FALSE仅保存 .tex 文件。 fig.folder: 字符串指定放置表格中所有行变量对应的图形的文件夹。如果省略将在 file 文件的相同文件夹中创建一个名为 file_figures 的文件夹。 compile: 逻辑值指示是否使用 texi2pdf 函数编译 .tex 文件。默认值为 TRUE。 openfile: 逻辑值指示是否打开已编译的 PDF 文件。目前已弃用默认值为 FALSE。 title: 字符串指定封面上的报告标题。默认值为 “Report”。 author: 字符串指定封面上的作者姓名。当省略时封面上不显示作者姓名。 date: 字符串指定封面上的报告日期。当省略时显示当前日期。 perc: 逻辑值指示是否在条形图中为分类变量显示相对频率百分比而不是绝对频率。 …: 传递给 export2latex 的其他参数。
示例
## Not run:
require(compareGroups)
data(regicor)
# example on an ordinary table
res - createTable(compareGroups(year ~ . -id, regicor), hide c(sex1), hide.no no)
report(res, report.pdf ,sizesmall, title\Huge \textbf{REGICOR study},authorIsaac Subirana \\ IMIM-Parc de Salut Mar)
# example on an stratified table by sex
res.men - createTable(compareGroups(year ~ . -id-sex, regicor, subsetsexMale),
hide.no no)
res.wom - createTable(compareGroups(year ~ . -id-sex, regicor, subsetsexFemale),
hide.no no)
res - cbind(Menres.men, Womres.wom)
report(res[[1]], reportmen.pdf, sizesmall,
title\Huge \textbf{REGICOR study \\ Men}, date) # report for men / no date
report(res[[2]], reportwom.pdf, sizesmall,
title\Huge \textbf{REGICOR study \\ Women}, date) # report for wom / no date
## End(Not run)
20、SNPs–病例对照研究中的snp
描述
snp数据框架包含病例对照研究中选定的snp和其他病例和对照的临床协变量。 snp .info.pos data.frame包含数据集“snp”中包含的snp的名称包括它们的染色体和它们的基因组位置。
用法
data(SNPs)21、strataTable–分层描述表
描述
该函数在由变量定义的层中重新构建描述性表。
用法
strataTable(x, strata, strata.names NULL, max.nlevels 5)x: 一个 ‘createTable’ 类的对象。 strata: 字符串指定定义分层的变量名称或该变量的值/水平。 strata.names: 字符向量包含与分层变量相关的名称。如果设置为 NULL默认值将使用分层变量水平的名称。 max.nlevels: 整数指定分层变量的最大唯一值或水平数。默认值为 5。
示例
require(compareGroups)
# load REGICOR data
data(regicor)
# compute the descriptive tables (by year)
restab - descrTable(year ~ . - id - sex, regicor, hide.nono)
# re-build the table stratifying by gender
strataTable(restab, sex)22、varinfo–提取变量名和标签
描述
该函数构建并打印一个包含变量名及其标签的表。
用法
varinfo(x, ...)
## S3 method for class compareGroups
varinfo(x, ...)
## S3 method for class createTable
varinfo(x, ...)x: 一个 ‘compareGroups’ 或 ‘createTable’ 类的对象。 …: 其他当前被忽略的参数。
示例
require(compareGroups)
data(regicor)
res-compareGroups(sex ~ . ,regicor)
#createTable(res, hide.no no)
varinfo(res)