新浪微博(網頁版搜索):Jenny愛學習
微信公眾號:R語言數據分析與實踐
更新時間:Feb 1st,2019
R語言由近幾年隨著數據挖掘、機器學習在國內興起而大熱,現在R已經發展成為一個社區語言,有者非常多的packages支持工程應用,幾乎任何問題都可以在R的packages中找到解決方案,這是R優于SPSS和SAS(模塊化分析)的一個強大功能。此外,對于沒有編程基礎的統計學和金融學領域分析人員,R語言以較易的代碼任務而勝過python(需要專門訓練的編程項目)。
目前在CRAN和GitHub上的packages大約超過1萬個。整理了一些常見學科使用頻率較高的packages:
教育類
beginr:R初學者函數
BIFIEsurvey:教育中的調查統計工具。
lessR:可視化、描述性統計分析教學
dslabs:可用于數據科學課程和講習班的數據集和函數可用于數據分析實踐、作業和項目。
Chaos Game:混沌游戲。
childesr:實現對CHILDES(開放式親子互動記錄庫)的接口
earnr:支持使用markdown等工具創建交互式的教材,進行R和R包的學習
olsrr:輔助進行普通最小二乘回歸的學習和實踐
rODE:內置大量函數,展示學生的一些自然狀態下的表現,如常微分方程如何求解,如何更有效的構建方程等。
repurrrsive:包含R對象、JSON和XML的形式遞歸的列表,用于在教學中使用示例,包括調色板、GitHub庫等
工具類
tidyxl:閱讀不整潔的excel文件
stevedore:Docker客戶端
RMySQL:MySQL驅動接口
pagedown:CSS格式與HTML輸出
tmap:專題地圖
dataPreparation:數據準備
htmlTable:Markdown/HTML標記工具
OpenImageR:圖片處理工具
REKKL:在R中使用KEEL代碼
smartdata:數據預處理
cdata:流體數據轉換
abstractr:用于創建抽象視覺的shiny應用
kutils:項目管理工具
pkgnet:獲取R包的網絡表示
rsparkingling:H2O接口
geoknife:大型網格化數據集的網絡處理
MazamaSpatialUtils:空間數據下載
cleanerR:缺失值處理
SQRL:與基于ODBC協議的數據庫交互的接口。
crul:HTTP客戶端
bitsqueezr:提供用于精確保持壓縮的浮點量化算法的實現。
timeR:為代碼運算計時
OpenCL:OpenCL的R調用界面
Ohmage:Ohmage2服務器的R客戶端
httr:URL和http工具
httptest:http請求測試環境
pkgsearch:在CRAN中查找R包
googleAnalyticsR:谷歌分析API
AzureContainers:微軟云計算工具Azure接口界面
AzureStor:Azure中數據的存儲和管理
AzureVM:通過Azure實現數據科學的虛擬技術。
spatialwidget: 將空間數據轉換為網頁支持的JSON格式。
codetools:R代碼分析工具
bookdown:使用R Markdown編寫圖書和技術文檔。
expss:從電子表格和SPSS中讀取數據、標簽、函數等。
romero.gateway: OMERO接口。
surveydata:調查數據處理工具。
httpuv:提供了用于處理http和服務器端的簡單套接字和協議。
多邊形符號數據分析
psda:GeoJSON:GeoJSON和簡單的功能,對象之間進行轉換。
rvcheck:R、R包版本檢查
rsppfp:R的最短路徑問題
pkgdown:將用戶文件制作為靜態html文檔
gcite:谷歌引用解析器
farver:調用顏色空間實現顏色轉換
DatapackageR: 提供一個框架,支持以可重現的方式構造R數據包.
hedgehog: 允許用戶根據隨機生成的輸入測試其程序的屬性,與單元測試相比,提供了更優越的測試覆蓋率.
jsonstat: 實現JSON-stat的接口,JSON-stat是一種簡單、輕量級的“JSON”格式,用于數據傳播.
nseval: 提供用于惰性和非標準評估的API,該API具有捕獲、檢查、操作和創建惰性值、“…”列表和活動調用的功能.
runner: 提供具有不同窗口大小的運行函數(窗口化、滾動、累積)和R向量的缺少處理選項.
RTest: 提供基于XML的測試框架,用于為監管環境開發的R軟件包的自動化組件測試.
dataCompare:用于比較兩個表格數據對象的函數, 其目的是顯示差異,從而使理解差異更容易。
datastructures:提供先進的數據結構,如哈希圖
catch:對多維數組進行分類和變量選擇的功能
dplyr:本地數據集的常用操作
jsonlite:良好的網絡API接口,適用于收集JSON數據
AWR:安裝編譯的Java模塊
filesstrings:提供了多個工具操作字符和文件
ggraph:提供了多個函數,擴展ggplot2的可視化功能
經濟
BCDating:商業周期和繪制工具
busdater:企業標準數據計算
riskParityPortfolio:金融投資的風險均衡投資組合的快速設計。
bayesm:市場/微觀經濟學貝葉斯推斷
PortfolioAnalytics:投資組合分析函數庫(包括投資組合優化等方法)
alphavantager :提供了alpha vantage API,可以獲取股票、物理貨幣和數字貨 幣等歷史交易數據。
estudy2:實現了事件研究模型,包括收益率估計和其他經典模型。
音樂
chorrrds:音樂和旋提取
tabr:支持通過R代碼生成樂譜
bioacoustics:錄音數據分析,同時可以提取動物聲音、處理常見格式聲音、過濾有噪聲的文件
billboard 包含了從1960年到2016年公告牌百強榜單上歌曲的數據集,包括給定年份的排名、音樂特征和歌詞。
地理
NLMR:模擬自然地形模型
landscapemetrics:分類地圖
GSIF:全球土壤信息設施
HelperMG:地球氣息分析工具
filedRS: 利用Olofsson等人提出的最佳實踐, 為遙感現場工作提供支持.
rayshader: 提供使用光線跟蹤、球面紋理映射、朗伯反射和環境遮擋的組合的函數,以生成高程矩陣的山體陰影,包括水檢測和分層功能、可編程調色板生成、內置紋理、2D和3D繪圖選項等.
mapsapi:提供了谷歌地圖數據接口
公益
PetfindR: 可以從Petfinder(北美最大的在線搜索可領養動物和動物福利組織數據庫)中提取數據和交互
學術語義
microdemic:支持在Microsoft Academ Graph中對學術文章的程序化訪問。
交互
mapdeck: 提供使用Mapbox GL(用于交互式地圖的JavaScript庫)和Deck.gl(使用WebGL可視化大型數據集的JavaScript庫)繪制交互式地圖的機制.
rayshader: 提供使用光線跟蹤、球面紋理映射、朗伯反射和環境遮擋的組合的函數,以生成高程矩陣的山體陰影,包括水檢測和分層功能、可編程調色板生成、內置紋理、2D和3D繪圖選項等.
sigmajs: 提供sigma.js圖形可視化庫的接口訪問.
GoogleVis API在R制作網頁HRML,調用Google charts作圖,交互式的HTML圖表
Manipulate:人際互動
Rcharts:用R與javascript做交互式可視化產品
Shiny:制作嵌入網頁的交互式R程序平臺
Solidify:制作和發布基于R的報告
shinyalert:提供在shiny中創建美觀UI的功能
自然語言處理
tidyxl:閱讀不整潔的excel文件
pdftools:pdf格式文本處理工具
quanteda:文本數據的定量分析
languageR:語言學數據分析工具
sigr:報道中的簡明、正確、統計摘要方法
lhs:拉丁超多維數據集示例及研究方法
readr:讀取文本數據
CRF:條件隨機場。是一種無向圖模型,它的目標是尋找在條件概率最大情況下的一種組合,應用于命名實體識別、文本淺層分析等信息抽取任務等實驗,實現句法語義自動標注?;谀J狡ヅ?、機器學習、支持向量機等方法。可用于復雜的最長名詞短語識別、漢語詞法分析研究。
tm: 文本挖掘
jiebaR:中文分詞工具,本身是C++寫的,具有極高的運算處理速度
Rwordseg:中文分詞工具,Mac版依賴舊版本的Java,較難安裝,版本更新慢,不推薦使用
chinese.misc:中文分詞工具,內核基于Rwordseg
rmmseg4j:
snowball:英文詞干化
lexiconPT:為情緒分析提供對葡萄牙詞匯的訪問
wordmatch:用于兩個word文本對照
readtext:支持文本文件導入,
.csv,.tab,.json,.xml,.pdf,.docx,.xls,.xlsx
officer:在R中對PPT、Word文件導入、導出、編輯
在線數據API
getTBinR:獲取世衛組織結核病數據
UCSCXenaTools:從UCSC Xena數據庫獲取數據和探索分析
congressbr:巴西聯邦參議院和眾議院的立法數據
taxize:網絡分類信息
rdbnomics:下載DBnomics數據
rehydratoR:從Tweets中下載推文
RSmartlyIO:從Facebook和Instagram廣告中下載數據
googledrive:GoogleDrive接口
streamR:Twitter Streaming API
crypto:加密貨幣市場數據
rnrfa:英國國家河流數據檔案API
arkdb: 提供將表從關系數據庫連接、導出到壓縮文本文件中的功能,并將這些文本文件導入數據庫,而無需將整個表放入工作內存中.
dobson:GLM書本數據
cancensus:從“CensusMapper”API獲取加拿大人口普查數據和地理信息
sparkbq: 通過提供與Google BigQuery的集成來擴展sparklyr.它支持從/向BigQuery直接導入/導出,及從Google云存儲中提取中間數據等功能.
sigmajs: 提供sigma.js圖形可視化庫的接口訪問.
aws.kms: 實現AWS密鑰管理服務(用于管理加密密鑰的云服務)的接口.
vapour: 提供對地理空間數據抽象庫GDAL的低級訪問.
nsapi:Nederlandse Spoorwegen(荷蘭鐵路)API接口. 用戶可下載當前站點的出發時間、站點列表、每個站點的旅行建議等數據.
repec: 通過RESTful API訪問RePEc(經濟學研究論文)
rfacebookstat: Facebook營銷API借口, 允許用戶多種方式加載數據.
UCSCXenaTools: 頂級基因庫. 支持對USCS Xena數據中心等數據訪問. 是UCSC托管等公共數據庫的集合.
ZipRadius: 當給定起始郵政編碼和半徑(單位:英里)時, 在該數據框下, 可生成對于等美國郵政編碼及其到給定郵政編碼的距離.
essurvey:歐洲社會調查(European Social Survey)下載所需數據
mleap:為MLeap提供了sparklyr擴展,可以導出Apache Spark管道
rdfp:提供谷歌DFP(DoubleClick for Publishers)的訪問接口
hdf5r:提供一個使用R6類的HDF5 API的面向對象包裝器。
odbc:可以使用DBI接口來創建一個數據庫連接,只要滿足ODBC連接即可使用此包進行便 捷的連接功能。
RMariaDB:實現與MariaDB and MySQL數據庫兼容的DBI接口。
geoops v0.1.2: 提供針對用GeoJSON地理空間數據進行格式轉換的工具.
linl v0.0.2: 添加LaTeX字符類到rmarkdown,使用與rmarkdown相適應的pandoc-letter模板.
rcreds v0.6.6: 提供從加密文件讀取和寫入憑證的功能.
RMariaDB v1.0-2: 實現與MariaDB and MySQL數據庫兼容的DBI接口.
securitytxt v0.1.0: 提供識別和解析security.txt文件的工具,使之能夠分析并采用Web安全策略草案標準.
usethis v1.1.0: 自動化包和項目設置任務,包括建立單元測試,測試覆蓋率,持續集成,Git,GitHub,許可證,RStudio項目等等,否則需要手動執行.
xltabr v0.1.1: 它提供了可以使用[openxlsx](https://cran.r -project.org/package= openxlsx)來生成良好格式化的跨列表的函數,它已經被開發用來幫助自動化發布官方統計數據
photobiologySun:提供外星太陽光譜輻照度、地平面太陽光譜輻照度的數據
Matrix
MASS
gsl
polynom
signal
GetLattesData:實現了一個API,支持從Lattes直接下載和讀取XML數據
數學
Rpolyhedra:多面體數據庫
CovTools:協方差分析的統計工具
pointdexter:多邊形內的標簽點
GMMAT:廣義線性混合模型關聯試驗
fromo:支持向量和矩陣的計算,以及矩陣的單點追加。
plsdof:最小二乘回歸
mpoly:多項式計算
MonteCarlo:蒙特卡洛模擬方法
mlogit:多項式邏輯模型
bigalgebra:矩陣及大型矩陣計算。
Delaporte:Delaporte分布統計函數
doremi: 支持利用微分方程和線性混合效應回歸函數來估計方程的特征參數.
bivariate : 提供用于構造、繪制雙變量概率分布的便捷函數.
eikosograms: eikosogram(來自古希臘ε?κ?σ的概率圖 )將單位正方形劃分為矩形區域,其區域、邊和寬度表示與一個或多個分類變量的值相關聯的各種概率.
freegroup:支持進行抽象數學(抽象代數)的相關分析與應用
SimCorrMix:提供生成具有特定相關矩陣等連續(正態、非正態、混合分布)、二元、有序變量的方法等
可視化
gganimate:在R中繪制動態圖
IPWboxplot:存在缺失對象的箱型圖繪制
OutliersO3:繪制異常值O3圖
handyplots:快速繪制圖形,Q-Q圖、箱型圖、置信區間等
WVPlots:常見數據分析可視化繪制
gplots:提供可視化數據繪制工具
vioplot:小提琴圖
rainbow:條形圖、箱型圖、彩虹圖繪制
treemapify:在ggplot2中繪制樹狀圖
ezplot:常見圖表繪制函數集
spaceRGB:RGB定義工具
r2d3: 3D可視化工具
discoveR:通過shiny實現的可視化探索性數據分析接口,包括聚類、主成分分析等
scico:基于科學色彩地圖的顏色板
DesignLibrary: 提供一個簡單的界面來構建設計,允許用戶在一系列參數組合(如效果大小、樣本量和分配概率)之間比較給定設計的性能.
survsup : 實現繪制生存曲線的函數.
ggjoy
r2d3:利用D3庫進行數據的動態和交互式的可視化
rgl:3D可視化
ggplot2:高級繪圖包
ggplotgui:支持shiny app創建和優化ggplot2圖形,并產生要求的R代碼
lattice:高級繪圖包
corrplot
plotly:基于網絡的ggplot2交互地圖
wordcloud2:繪制詞云
ggjoy:joyplots提供了時間和空間分布的變化
DescriptiveStats.O Beu:包含部分函數為OpenBudgets.eu數據集提供估計和返回可視化所需的相關參數。
iheatmapr v0.4.2: 支持繪制復雜的、交互式的熱圖.
otvPlots v0.2.0: 支持自動可視化變量分布,并為大型數據集計算時間匯總匯總統計數據
統計學
homomorpheR:同態計算
HARModel:異構自回歸模型
npsm:非參統計建模
GAS:廣義自回歸評分模型
ado:過度分散數據分析
riskRegression:風險回歸模型與競爭風險生存分析的預測分數
ROCit:基于可視化的二元分類器性能評估
plot3logit:三項式回歸模型的三元圖
weibulltools:生命周期分析。例如汽車里程數
dominanceanalysis:優勢分析
nlreg:非線性模型的高階推理
concurve:計算和繪制置信度
pairwise:基于配對算法的Rasch模型參數
hyper.fit :超平面你和和可視化。允許用戶產生強大的一維線性類型數據、二維平面適合數據,以及n維數據集的任何(n-1)超平面模型。
gendist:生成概率分布模型
MVN:多變量的正態分布檢驗
JointNets:稀疏高斯圖形模型估計、可視化和評價。
Fstability:有兩個函數幫助計算特征穩定性。
CPAT:變點分析測試。
glmmboot:混合效應和普通模型的模擬抽樣方法。
miWQS:多重加權分量分析。
svydiags:用于調查數據的線性回歸模型診斷。
netmeta:基于頻度的Meta網絡分析法
rsample:通過函數和類驗證不同類型的樣本(如交叉驗證)
Rnmr1D : 提供從自由感應衰變的原始數據處理質子核磁共振譜的功能,參見Jacob et al.
bcaboot: 提供函數以一種幾乎自動的方式計算bootstrap置信區間.
blandr:包含進行Bland Altman分析功能(也被稱為杜克均值差圖)
cnbdistr:提供條件負二項分布函數
dqrng:具有良好統計特性的快速隨機數生成器,包括Mersenne-Twister(64位)、pcg64、Xoroshiro128、Xoroshiro256
XGBoost:高效的算法包
cultevo:距離矩陣相關性等Mantel檢驗
adaptiveGPCA:自適應的主成分分析算法實踐
sfdct:支持針對簡單的對象構建德勞內三角
cnbdistr:條件負二項分布的分布函數
llogitstic:密度、分布、帶參數的l-logistic分布分位數和隨機數生成函數
RBest:提供支持貝葉斯證據合成的工具集,包括薈萃分析、歷史數據的先驗推 導、操作特性分析
SMM:提供了多狀態離散時間半馬爾可夫和馬爾可夫模型多模擬和估計功能。
BayesRS:適用于分層線性貝葉斯模型,并計算出與savge-dickey密切比有關的群參數的貝葉斯因子。
CovTools:提供了幾何和推理工具,方便分析協方差結構和多元統計中的協方差分析。
emmeans:提供了許多函數,計算線性/廣義線性/混合模型的估計邊際均值(EMMS)
BayesRS v0.1.2: 適用于分層線性貝葉斯模型,并計算出與savage - dickey密度比有關的群參數的貝葉斯因子(見Wetzels et al.(2009).
CatPredi v1.1: 允許用戶通過最大化模型的判別能力,將連續預測變量分類為邏輯推理或Cox比例風險回歸設定,可參見Barrio et al. (2015) and Barrio et al. (2017).
CovTools v0.2.1: 提供了幾何和推理工具,方便分析協方差結構和多元統計中的協方差分析,可參見Schervish (1987).
genlogis v0.5.0: 對Rathie和Swamee (2006)提出的廣義邏輯回歸分布提供了基本的分布函數.
emmeans v0.9.1: 提供了許多函數,計算線性/廣義線性/混合模型的估計邊際均值(EMMS).
貝葉斯
BayesMallows:基于Mallows Rank模型的貝葉斯偏好
bayesCT:自適應貝葉斯臨床試驗的模擬與分析
bssm:非線性和非高斯狀態空間模型的貝葉斯推理
abn:廣義線性模型、多元線性回歸、最優貝葉斯網絡模型。
BHSBVAR:構造貝葉斯向量自回歸模型。
RSE:貝葉斯加權估計??捎脕砉烙嬈渌鷳B樣本中新發現的稀有物種的數量
tidybayes: 提供組合數據的功能,以整齊的數據格式從貝葉斯模型(JAGS、Stan、rstanarm、brms...)中提取、操作和可視化.
BACCO
bayesm
bayesSurv
LaplacesDemon
MIBayesOpt:提供了一套支持貝葉斯優化方法的計算框架,輔助支持向量機、隨機森林和極端梯度增強模型優化超參數。
生物醫學
BGData:大基因組數據分析套件
getTBinR:獲取世衛組織結核病數據
ICDS:腫瘤功能障礙鑒定亞途徑,基于DNA甲基化、復制數變異和基因表達的數據
UCSCXenaTools:從UCSC Xena數據庫獲取數據和探索分析
genoPlotR:繪制人口基因組與基因地圖
bayesCT:自適應貝葉斯臨床試驗的模擬與分析
PTE:個性化治療評估。為個性化的醫學模型提供推斷。
NetworkToolbox:腦、認知、心理網絡分析方法
MetabolicSurV:利用代謝組學特征進行分類和預測生存的生物標志物驗證方法
cliqueMS:代謝組學分析工具
simcdm:模擬認知診斷模型數據
Eagle:在基因組范圍內實現多位點關聯映射?;诰€性混合模型,適合于連續性狀的數據分析。
Buddle:使用深度學習方法實現統計分類。案例數據包括臨床試驗患者的統計分類、預測疾病的臨床分析。考慮到今日疾病的負面影響,及時正確的對病患進行確診,在臨床中是關鍵的。確定高?;颊呷后w,并在適當時機安排醫療方案。借助深度學習方法,幫助在各種具有挑戰性的臨床試驗中尋找答案。
webddx:在線診斷生成工具。用戶可以生成列出給定的一組癥狀鑒別診斷,web工具可能會被用于臨床實踐,但方案交互和數據操作能大大提高效率和再現性研究臨床信息。
GenoScan:用于全基因組序列分析的全基因組掃描統計框架
benford.analysis: 基于Benford方法的數據驗證和法醫鑒定。
bamp:貝葉斯年齡-時期隊列模型。使用馬爾可夫鏈和蒙特卡洛模擬方法。
epibasix:提供流行病學及生物統計學的基本流行病學函數
speaq:OOL核磁共振波譜對其,基于峰值處理、定量分析和可視化。
SimInf:大規模流行疾病傳播的模擬仿真。模型采用馬爾可夫鏈、吉萊斯皮隨機模擬算法。
pathfindR:通過提供的基因列表識別蛋白質-蛋白質相互作用路徑,并對已確定的子網絡實現途徑強化分析,確定具有代表性的路徑。幫助研究人員能夠發現表行背后的機制。
BioInstaller:生物信息學資源集合
UCSCXenaTools: 頂級基因庫. 支持對USCS Xena數據中心等數據訪問. 是UCSC托管等公共數據庫的集合.
DSAIRM: 提供一組Shiny應用程序,實現動態模擬系統, 探索宿主免疫反應.
localIV: 提供使用局部工具變量估計邊際治療效果的函數,參見Heckman et al. (2006)、Zhou and Xie (2018)
epiflows:提供用于處理、可視化區域間流行病流動的功能和類別, 以及用于預測疾病傳播的統計方法.
GROAN:一個測試基因組回歸準確性的工作臺。
grf:提供了非參數最小二乘回歸、量化回歸和治療效果估計的方法
chromoMap:人類染色體的交互式圖形可視化,引入染色體熱圖
DrInsight:能夠反向查詢疾病表型或者查詢相似功能藥物
CytobankAPIstats:提供了從細胞庫獲取和處理細胞數據的工具。
SympluR:通過訪問Symplur接口,提供了對醫療社會圖(Healthcare Social Graph)進行數據分析的功能
cRegulome:提供方法來構建預計算的轉錄因子或microRNA的SQLite數據庫文件,數據源于Cistrome和miRCancerdb數據庫
detectRUNS:提供滑動窗口(Purcell等)和連續運行(Marras等)等方法,檢測二倍體基因組中純合性和雜合性的運行。
malariAtlas:從瘧疾地圖集項目服務器下載公共可用數據。
機器學習
gclus:聚類繪圖
greybox:建模與預測分析工具
automl:Metaheuristic方法深度學習
ordinaLBM:基于連續隨機變量的聚類
protoclust:使用原型的聚類
ANN2: 使用ANN方法實現異常檢測。
MachineShop:機器學習模型和工具。
discoveR:通過shiny實現的可視化探索性數據分析接口,包括聚類、主成分分析等
CRF:條件隨機場。是一種無向圖模型,它的目標是尋找在條件概率最大情況下的一種組合,應用于命名實體識別、文本淺層分析等信息抽取任務等實驗,實現句法語義自動標注?;谀J狡ヅ?、機器學習、支持向量機方法??捎糜趶碗s的最長名詞短語識別、漢語詞法分析研究。
geoveg:社區數據分析,提供自動樹種的選擇和排序圖,計算和天氣表的排序等。
DALEX2: 描述機器學習的解釋。
FLSSS:組合優化問題中的子集和族。挖掘真實值和預定義的子集。
embed:通過廣義線性模型實現因子預測。
clustvarsel:高斯模型聚類
whilboclustering:白盒的聚類算法實現。這周方式可以重新創建現有聚類算法。
dials: 提供用于創建無法從數據直接估計模型參數的工具.
optional:可選模型和模式匹配
naniar:數據結構/概要/可視化數據缺失值的填補
modi:多元異常值檢測與數據缺失填補
mma:多個中介(媒介/介質/載體)分析
CARS:輔助排序和大型雙樣本刷選
caret:分類和回歸訓練
assertive.matrices:斷言檢查矩陣的性質
merlin: 根據Crowther(2017)開發的框架,提供適合線性、非線性和用戶自定義的混合效應回歸模型的函數.
MRFcov: 提供估計馬爾可夫隨機場圖形網絡的節點交互參數的函數
SCPME: 提供函數,支持通過擴展ADMM算法估計懲罰精度矩陣,如Molstad和Rothman(2018)所述.
survxai: 支持創建生存模型的統一表示,可以由各種生存解釋器進一步處理.
tosca: 提供內容分析中的統計分析框架.
tsmap: 實現Matrix Profile 概念以進行分類.
autoBagging:實現了一個自動化機器學習框架,重點是裝袋工作流程的優化
grf:提供了非參數最小二乘回歸、量化回歸和治療效果估計的方法
iRF:提供功能以迭代地增長特征加權的隨機森林,并以一種穩定的方式發現高階交互特征。
keras:實現了Keras的接口,這是一種高級神經網絡API,運行在TensorFlow之上
randomForestExplainer:提供一組工具來幫助解釋隨機森林中哪些變量最重要。
DALEX:提供各種解釋器,幫助理解機器學習模型中輸入變量與模型輸出之間的關聯關系。
forestControl:借助Konukoglu和Ganz所提供的方法,在隨機森林的頻率選擇中控制假陽性率。
kmed:基于Park和Jun的方法,實現了基于距離的k-medoids聚類算法,并通過重新排序矩陣算法生成圖來驗證聚類族
lolR:維度超過樣本大小的情況,實現了最佳低秩投影算法
projpred:提供了廣義線性模型進行投影預測特征選擇的方法
RGF:
apcluster :聚類
clusterSim:聚類
clustMixType:聚類
evclust:聚類
trimcluster:聚類
apcluster:聚類
時間序列
NlinTS:非線性時間序列分析
ftsa:功能時間序列函數
ctmm:連續時間移動模型
segMGarch:通過高緯度數據實現了一個分割為多個變點的檢測算法,研究數據集或其子集的時間序列變點。
tsxtreme:基于貝葉斯方法的時間序列分析。根據時間序列的極值依賴結構的特性,避免預處理和篩選高峰/閾值的方法。
NTS:非線性實踐序列分析。
beyondWhittle:非參數/半參數的單變量/多變量時間序列的貝葉斯分析
mets:多元事件時間序列分析
ctsem:連續實踐結構方程建模
ordinalCont:連續尺度的順序回歸分析
hpiR: 提供計算房價指數和序列的功能,并基于準確性、波動性和修正統計來評估指數的好壞.
STMotif: 提供函數來識別空間-時間序列中的基序(先前識別的子序列).
trawl : 提供模擬和估計Veraart(2018)中描述的整數值拖網過程的函數,以及模擬來自二元負二項和二元對數分布的隨機向量.
sweep:提供tidyverse作為時間序列預測工具。
timetk:針對時間序列問題,提供了一系列工具套件。
lubridate:輕量級時間序列操作包,包含大量時間序列處理函數
segclust2d:二元時間序列的分割、聯合分割、聚類
tstools:繪制官方統計時間序列
綜合學科
worrms:世界海洋物種登記(WoRMS)客戶端
qgraph:心理學數據可視化方法工具
raster:地理數據分析與建模
phreeqc:地球化學建模軟件的R接口
nhdR:國家水文數據集的工具
metScanR:環境數據分析工具
ropenaq:從OpenAQ上下載空氣質量數據
KnowBR:物種多樣性數據庫研究
stacomiR:魚類遷徙檢測
landscapemetrics:分類地圖
psychotools:心理測定模型基礎架構
forestChange:基于全球森林變化(森林區和森林破碎化)計算的生物多樣性變量的指標。
rvacon:基于貝葉斯方法的年齡-深度模型。使用放射性C衰變&歷史
AeRobiology:大氣生物學數值計算工具。
capm:人口動力學建模
asnipe:動物社會網絡分析。對社會網絡數據進行多元回歸分析。
gasfluxes:溫室氣體流量測定
openair:空氣污染分析工具,數據為小時序列。包含的功能也可用于氣象和交通分析。
meteoForecast:數值氣象預報
fdq:森林數據。
essurvey:歐洲社會調查(European Social Survey)下載所需數據
fishmethods:漁業學科建模和方法
|