2022年6月的中國數(shù)據(jù)庫流行度排行榜再掀風(fēng)云(完全報(bào)告參考“2022年6月中國數(shù)據(jù)庫行業(yè)分析報(bào)告:智能風(fēng)起,列存更生”),6月排行榜共有231個(gè)數(shù)據(jù)庫參與排名,兩名新成員的加入,注入了新活力。本月排行榜前十用一句話可以概括為:TiDB重奪冠軍寶座,達(dá)夢挺進(jìn)前三;人大金倉躋身六強(qiáng),AnalyticDB穩(wěn)居第十。 ![]() ![]() 由操作系統(tǒng)、數(shù)據(jù)庫、中間件 “三駕馬車”共同組成的基礎(chǔ)軟件,必須具備自主知識(shí)產(chǎn)權(quán),才能實(shí)現(xiàn)國產(chǎn)化。目前這些基礎(chǔ)軟件已經(jīng)具備天時(shí)地利,除了在技術(shù)端發(fā)力,構(gòu)建完整的信創(chuàng)生態(tài)圈至關(guān)重要。因此墨天輪本月新增了數(shù)據(jù)產(chǎn)品、中間件、操作系統(tǒng)、芯片的排行榜,以供大家參考。 ![]() 2022年5月,數(shù)據(jù)庫管理初創(chuàng)公司 OtterTune 宣布完成了1200萬美元A輪融資。OtterTune 于2021年成立于美國,是一家旨在利用人工智能,幫助DBA自動(dòng)化調(diào)優(yōu)數(shù)據(jù)庫的公司。OtterTune 通過利用AI技術(shù)來分析數(shù)據(jù)庫的運(yùn)行狀態(tài),對數(shù)據(jù)庫的運(yùn)行參數(shù)進(jìn)行持續(xù)自動(dòng)調(diào)優(yōu),并僅占用較少的系統(tǒng)資源。它適用于基于云的 PostgreSQL 和 MySQL 數(shù)據(jù)庫(Amazon RDS 和 Amazon Aurora)。 ![]() PostgreSQL 全球開發(fā)組宣布 PostgreSQL 15 的第一個(gè) beta 版本現(xiàn)已可供下載。此版本包含 PostgreSQL 15 正式可用時(shí)將提供的所有功能的預(yù)覽,但該版本的某些細(xì)節(jié)可能會(huì)在最終正式版發(fā)布時(shí)發(fā)生變化。 PostgreSQL 15 Beta 1 的功能亮點(diǎn):開發(fā)者體驗(yàn)提升、性能表現(xiàn)提升、備份、存檔和壓縮、邏輯復(fù)制、管理等。 ![]() 在Google I/O 2022活動(dòng)上,谷歌發(fā)布了AlloyDB for PostgreSQL,這是一個(gè)完全托管的、基于PostgreSQL 研發(fā)的、與PostgreSQL兼容的行列混存數(shù)據(jù)庫,適用于苛刻的企業(yè)級(jí)事務(wù)和分析工作負(fù)載。支持彈性存儲(chǔ)和計(jì)算、智能緩存、AI/ML支持的自治管理。 AlloyDB,針對分析查詢,由列存引擎提供支持,執(zhí)行速度比標(biāo)準(zhǔn)PostgreSQL快100倍。AlloyDB自動(dòng)在基于行的格式和列格式之間組織數(shù)據(jù),根據(jù)學(xué)習(xí)工作負(fù)載選擇正確的列和表,并自動(dòng)將其轉(zhuǎn)換為列格式,數(shù)據(jù)最初加載到內(nèi)存后,AlloyDB會(huì)監(jiān)控?cái)?shù)據(jù)的變化并確保自動(dòng)刷新。根據(jù)數(shù)據(jù)更改以及正在執(zhí)行的查詢操作,智能選擇基于列、基于行,或是行列混合查詢。 列存數(shù)據(jù)庫從數(shù)據(jù)存儲(chǔ)方式上區(qū)別于行存數(shù)據(jù)庫,所有數(shù)據(jù)按列存取。行存數(shù)據(jù)庫在做一些列分析時(shí),必須將所有列的信息全部讀取出來;而列存數(shù)據(jù)庫由于其按列存取的特性,在對特定列進(jìn)行查詢分析時(shí),能夠有效降低I/O,提高讀取性能。此外列存數(shù)據(jù)庫往往還能在數(shù)據(jù)壓縮上帶來更大壓縮比,節(jié)省了磁盤存儲(chǔ)空間。 在實(shí)踐中,列式數(shù)據(jù)庫非常適合 OLAP 類工作負(fù)載(例如,數(shù)據(jù)倉庫),這些工作負(fù)載通常涉及對所有數(shù)據(jù)(可能是PB級(jí))高度復(fù)雜的查詢。 在當(dāng)今數(shù)據(jù)大爆炸的時(shí)代,列存數(shù)據(jù)庫由于其存儲(chǔ)空間少,讀取磁盤少以及復(fù)雜數(shù)據(jù)查詢效率高的緣故,成為構(gòu)建數(shù)據(jù)倉庫的理想架構(gòu)?;谶@些管理和應(yīng)用上的優(yōu)勢,列存數(shù)據(jù)庫應(yīng)運(yùn)而生并得到了快速發(fā)展。列存數(shù)據(jù)庫的優(yōu)勢: 列的數(shù)據(jù)特征比較相似,適合壓縮,壓縮比很高,在數(shù)據(jù)量較大(如數(shù)據(jù)倉庫) 場景下會(huì)節(jié)省大量磁盤空間,同時(shí)也會(huì)提高單位作業(yè)下的 I/O 效率。 當(dāng)表中列數(shù)比較多,但是訪問的列數(shù)比較少時(shí),列存儲(chǔ)可以按需讀取列數(shù)據(jù),大大減少不必要的讀IO,提高查詢性能。 基于列批量數(shù)據(jù)向量運(yùn)算,結(jié)合向量化執(zhí)行引擎,CPU 的緩存命中率比較高,性能比較好,更適合 OLAP 大數(shù)據(jù)統(tǒng)計(jì)分析的場景。 列式存儲(chǔ)的起源,可以追溯到 1983年 Cantor 的論文《An Overview of Cantor - A new System for Data Analysis》,隨后在1985年SIGMOD85上發(fā)表的論文《A Decomposition Storage Model》全面提出列式存儲(chǔ)概念,成為列數(shù)據(jù)庫的雛形,這種技術(shù)在當(dāng)時(shí)并沒有得到足夠的重視。 ![]() · Sybase公司在1994年推出Sybase IQ Accelerator數(shù)據(jù)庫,這是Sybase IQ列存數(shù)據(jù)庫的雛形,由此列存數(shù)據(jù)庫便由理論在實(shí)踐中誕生了。 · 從1994年到2005年的十年時(shí)間,列式數(shù)據(jù)庫幾乎無人問津,而2005年被稱為列式數(shù)據(jù)庫的重生之年。這一年 Michael Stonebraker 教授發(fā)表了 C-Store 論文,隨后在此基礎(chǔ)上推出了商用的列式分析型數(shù)據(jù)庫 Vertica。 · 之后的15年間,因用戶需求逐漸從交易業(yè)務(wù)轉(zhuǎn)向分析業(yè)務(wù),列式數(shù)據(jù)庫的優(yōu)勢得以發(fā)揮,很多廠商開始投入列式數(shù)據(jù)庫的研發(fā),將其應(yīng)用到 OLAP 分析場景中。 · 亞馬遜在2012年發(fā)布了 Amazon Redshift 數(shù)據(jù)庫,采用列式存儲(chǔ),應(yīng)對 MPP 場景,通過云完全托管,可以實(shí)現(xiàn)自治管理、備份、運(yùn)行監(jiān)控等能力。 · 俄羅斯公司 Yandex 在2016年6月開源了 ClickHouse 列存數(shù)據(jù)庫,具備卓越性能,再次推動(dòng)了列存數(shù)據(jù)庫發(fā)展。 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() 下載鏈接: 2022年6月中國數(shù)據(jù)庫行業(yè)分析報(bào)告:智能風(fēng)起,列存更生 ???????????????? END ???????????????? 免責(zé)申明:本號(hào)聚焦相關(guān)技術(shù)分享,內(nèi)容觀點(diǎn)不代表本號(hào)立場,可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請留言刪除,謝謝。 |
|