久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    最好的Python機(jī)器學(xué)習(xí)庫

     復(fù)雜網(wǎng)絡(luò)621 2015-12-17

    最好的Python機(jī)器學(xué)習(xí)庫

    最好

    CSDN大數(shù)據(jù)(Scott Robinson) · 2015-12-10 17:36

    最好的Python機(jī)器學(xué)習(xí)庫


    CSDN移動(dòng)將持續(xù)為您優(yōu)選移動(dòng)開發(fā)的精華內(nèi)容,共同探討移動(dòng)開發(fā)的技術(shù)熱點(diǎn)話題,涵蓋移動(dòng)應(yīng)用、開發(fā)工具、移動(dòng)游戲及引擎、智能硬件、物聯(lián)網(wǎng)等方方面面。如果您想投稿、尋求《近匠》報(bào)道,或給文章挑錯(cuò),歡迎發(fā)送郵件至tangxy@csdn.net

    引言

    毫無疑問,神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)在過去幾年一直是高科技領(lǐng)域最熱門的話題之一。這一點(diǎn)很容易看出,因?yàn)樗鼈兘鉀Q了很多真正有趣的用例,如語音識(shí)別、圖像識(shí)別、甚至是樂曲譜寫。因此,在這篇文章,我決定編制一份囊括一些很好的Python機(jī)器學(xué)習(xí)庫的清單,并將其張貼在下面。

    在我看來,Python是學(xué)習(xí)(和實(shí)現(xiàn))機(jī)器學(xué)習(xí)技術(shù)最好的語言之一,其原因主要有以下幾點(diǎn):

    語言簡單:如今,Python成為新手程序員首選語言的主要原因是它擁有簡單的語法和龐大的社區(qū)。

    功能強(qiáng)大:語法簡單并不意味著它功能薄弱。Python同樣也是數(shù)據(jù)科學(xué)家和Web程序員最受歡迎的語言之一。Python社區(qū)所創(chuàng)建的庫可以讓你做任何你想做的事,包括機(jī)器學(xué)習(xí)。

    豐富的ML庫:目前有大量面向Python的機(jī)器學(xué)習(xí)庫。你可以根據(jù)你的使用情況、技術(shù)和需求從數(shù)百個(gè)庫中選擇最合適的一個(gè)。


    上面最后一點(diǎn)可以說是最重要的。驅(qū)動(dòng)機(jī)器學(xué)習(xí)的算法相當(dāng)復(fù)雜,包括了很多的數(shù)學(xué)知識(shí),所以自己動(dòng)手去實(shí)現(xiàn)它們(并保證其正常運(yùn)行)將會(huì)是一件很困難的任務(wù)。幸運(yùn)地是,有很多聰明的、有奉獻(xiàn)精神的人為我們做了這個(gè)困難的工作,因此我們只需要專注于手邊的應(yīng)用程序即可。

    這并不是一個(gè)詳盡無遺的清單。有很多代碼并未在此列出,在這里我只會(huì)發(fā)布一些非常相關(guān)或知名的庫。下面,來看看這份清單吧。

    最受歡迎的庫

    我已經(jīng)對(duì)一些比較流行的庫和它們擅長的方向做了一個(gè)簡短的描述,在下一節(jié),我會(huì)給出一個(gè)更完整的項(xiàng)目列表。

    Tensorflow

    這是清單中最新的神經(jīng)網(wǎng)絡(luò)庫。在前幾天剛剛發(fā)行,Tensorflow是高級(jí)神經(jīng)網(wǎng)絡(luò)庫,可以幫助你設(shè)計(jì)你的網(wǎng)絡(luò)架構(gòu),避免出現(xiàn)低水平的細(xì)節(jié)錯(cuò)誤。重點(diǎn)是允許你將計(jì)算表示成數(shù)據(jù)流圖,它更適合于解決復(fù)雜問題。

    此庫主要使用C++編寫,包括Python綁定,所以你不必?fù)?dān)心其性能問題。我最喜歡的一個(gè)特點(diǎn)是它靈活的體系結(jié)構(gòu),允許你使用相同的API將其部署到一個(gè)或多個(gè)CPU或GPU的臺(tái)式機(jī)、服務(wù)器或者移動(dòng)設(shè)備。有此功能的庫并不多,如果要說有,Tensorflow就是其一。

    它是為谷歌大腦項(xiàng)目開發(fā)的,目前已被數(shù)百名工程師使用,所以無須懷疑它是否能夠創(chuàng)造有趣的解決方案。

    盡管和其它的庫一樣,你可能必須花一些時(shí)間來學(xué)習(xí)它的API,但花掉的時(shí)間應(yīng)該是很值得的。我只花了幾分鐘了解了一下它的核心功能,就已經(jīng)知道Tensorflow值得我花更多的時(shí)間讓我來實(shí)現(xiàn)我的網(wǎng)絡(luò)設(shè)計(jì),而不僅僅是通過API來使用。

    • 擅長:神經(jīng)網(wǎng)絡(luò)

    • 網(wǎng)址:http:///

    • Github: https://github.com/tensorflow/tensorflow


    scikit-learn

    scikit-learn絕對(duì)是其中一個(gè),如果不是最流行的,那么也算得上是所有語言中流行的機(jī)器學(xué)習(xí)庫之一。它擁有大量的數(shù)據(jù)挖掘和數(shù)據(jù)分析功能,使其成為研究人員和開發(fā)者的首選庫。

    其內(nèi)置了流行的NumPy、SciPy,matplotlib庫,因此對(duì)許多已經(jīng)使用這些庫的人來說就有一種熟悉的感覺。盡管與下面列出的其他庫相比,這個(gè)庫顯得水平層次略低,并傾向于作為許多其他機(jī)器學(xué)習(xí)實(shí)現(xiàn)的基礎(chǔ)。

    • 擅長:非常多

    • 網(wǎng)址:http:///

    • Github: http://github.com/scikit-learn/scikit-learn


    Theano

    Theano是一個(gè)機(jī)器學(xué)習(xí)庫,允許你定義、優(yōu)化和評(píng)估涉及多維數(shù)組的數(shù)學(xué)表達(dá)式,這可能是其它庫開發(fā)商的一個(gè)挫折點(diǎn)。與scikit-learn一樣,Theano也很好地整合了NumPy庫。GPU的透明使用使得Theano可以快速并且無錯(cuò)地設(shè)置,這對(duì)于那些初學(xué)者來說非常重要。然而有些人更多的是把它描述成一個(gè)研究工具,而不是當(dāng)作產(chǎn)品來使用,因此要按需使用。

    Theano最好的功能之一是擁有優(yōu)秀的參考文檔和大量的教程。事實(shí)上,多虧了此庫的流行程度,使你在尋找資源的時(shí)候不會(huì)遇到太多的麻煩,比如如何得到你的模型以及運(yùn)行等。

    • 擅長:神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)

    • 網(wǎng)址:http:///software/theano/

    • Github:https://github.com/Theano/Theano


    Pylearn2

    大多數(shù)Pylearn2的功能實(shí)際上都是建立在Theano之上,所以它有一個(gè)非常堅(jiān)實(shí)的基礎(chǔ)。

    據(jù)Pylearn2網(wǎng)址介紹:

    Pylearn2不同于scikit-learn,Pylearn2旨在提供極大的靈活性,使研究者幾乎可以做任何想做的事情,而scikit-learn的目的是作為一個(gè)“黑盒”來工作,即使用戶不了解實(shí)現(xiàn)也能產(chǎn)生很好的結(jié)果。

    記住,Pylearn2在合適的時(shí)候會(huì)封裝其它的庫,如scikit-learn,所以在這里你不會(huì)得到100%用戶編寫的代碼。然而,這確實(shí)很好,因?yàn)榇蠖鄶?shù)錯(cuò)誤已經(jīng)被解決了。像Pylearn2這樣的封裝庫在此列表中有很重要的地位。

    • 擅長:神經(jīng)網(wǎng)絡(luò)

    • 網(wǎng)址:http:///software/pylearn2/

    • Github:http://github.com/lisa-lab/pylearn2


    Pyevolve

    神經(jīng)網(wǎng)絡(luò)研究更讓人興奮和不同的領(lǐng)域之一是遺傳算法。從根本上說,遺傳算法只是一個(gè)模擬自然選擇的啟發(fā)式搜索過程。本質(zhì)上它是在一些數(shù)據(jù)上測試神經(jīng)網(wǎng)絡(luò),并從一個(gè)擬合函數(shù)中得到網(wǎng)絡(luò)性能的反饋。然后對(duì)網(wǎng)絡(luò)迭代地做小的、隨機(jī)的變化,再使用相同的數(shù)據(jù)進(jìn)行測試。將具有高度擬合分?jǐn)?shù)的網(wǎng)絡(luò)作為輸出,然后使其作為下一個(gè)網(wǎng)絡(luò)的父節(jié)點(diǎn)。

    Pyevolve提供了一個(gè)用于建立和執(zhí)行這類算法很棒的框架。作者曾表示,V0.6版本也支持遺傳編程,所以在不久的將來,該框架將更傾向于作為一個(gè)進(jìn)化的計(jì)算框架,而不只是簡單地遺傳算法框架。

    • 擅長:遺傳算法的神經(jīng)網(wǎng)絡(luò)

    • Github:https://github.com/perone/Pyevolve


    NuPIC

    Nupic是另一個(gè)庫,與標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)算法相比,它提供了一些不同的功能。它基于一個(gè)稱作層次時(shí)間記憶(HTM)的新皮層理論,。HTMs可以看作是一類神經(jīng)網(wǎng)絡(luò),但在一些理論上有所不同。

    從根本上說,HTMs是一個(gè)分層的、基于時(shí)間的記憶系統(tǒng),可以接受各種數(shù)據(jù)。這意味著會(huì)成為一個(gè)新的計(jì)算框架,來模仿我們大腦中的記憶和計(jì)算是如何密不可分的。

    • 擅長:HTMs

    • Github:http://github.com/numenta/nupic


    Pattern

    此庫更像是一個(gè)“全套”庫,因?yàn)樗粌H提供了一些機(jī)器學(xué)習(xí)算法,而且還提供了工具來幫助你收集和分析數(shù)據(jù)。數(shù)據(jù)挖掘部分可以幫助你收集來自谷歌、推特和維基百科等網(wǎng)絡(luò)服務(wù)的數(shù)據(jù)。它也有一個(gè)Web爬蟲和HTML DOM解析器。“引入這些工具的優(yōu)點(diǎn)就是:在同一個(gè)程序中收集和訓(xùn)練數(shù)據(jù)顯得更加容易。

    在文檔中有個(gè)很好的例子,使用一堆推文來訓(xùn)練一個(gè)分類器,用來區(qū)分一個(gè)推文是“win”還是“fail”。

    from pattern.web import Twitter  
    from pattern.en import tag  
    from pattern.vector import KNN, count
    
    twitter, knn = Twitter(), KNN()
    
    for i in range(1, 3):  
        for tweet in twitter.search('#win OR #fail', start=i, count=100):
            s = tweet.text.lower()
            p = '#win' in s and 'WIN' or 'FAIL'
            v = tag(s)
            v = [word for word, pos in v if pos == 'JJ'] # JJ = adjective
            v = count(v) # {'sweet': 1}
            if v:
                knn.train(v, type=p)
    
    print knn.classify('sweet potato burger')  
    print knn.classify('stupid autocorrect')  

    首先使用twitter.search()通過標(biāo)簽'#win'和'#fail'來收集推文數(shù)據(jù)。然后利用從推文中提取的形容詞來訓(xùn)練一個(gè)K-近鄰(KNN)模型。經(jīng)過足夠的訓(xùn)練,你會(huì)得到一個(gè)分類器。僅僅只需15行代碼,還不錯(cuò)。

    • 擅長:自然語言處理(NLP)和分類。

    • Github:http://github.com/clips/pattern


    Caffe

    Caffe是面向視覺應(yīng)用領(lǐng)域的機(jī)器學(xué)習(xí)庫。你可能會(huì)用它來創(chuàng)建深度神經(jīng)網(wǎng)絡(luò),識(shí)別圖像中的實(shí)體,甚至可以識(shí)別一個(gè)視覺樣式。

    Caffe提供GPU訓(xùn)練的無縫集成,當(dāng)你訓(xùn)練圖像時(shí)極力推薦使用此庫。雖然Caffe似乎主要是面向?qū)W術(shù)和研究的,但它對(duì)用于生產(chǎn)使用的訓(xùn)練模型同樣有足夠多的用途。

    • 擅長:神經(jīng)網(wǎng)絡(luò)/視覺深度學(xué)習(xí)

    • 網(wǎng)址:http://caffe./

    • Github:https://github.com/BVLC/caffe


    其它知名庫

    這里還列出了一些其它面向Python的機(jī)器學(xué)習(xí)庫。其中一些庫與上述庫有著相同的功能,而另一些則有更窄小的目標(biāo)或是更適合當(dāng)作學(xué)習(xí)工具來使用。

    包括:Nilearn、Statsmodels、PyBrain (inactive)、Fuel、Bob、skdata、MILK、IEPY、Quepy、Hebel、mlxtend、nolearn、Ramp、Feature Forge、REP、Python-ELM、PythonXY、XCS、PyML、MLPY (inactive)、Orange、Monte、PYMVPA、MDP (inactive)等。點(diǎn)擊閱讀原文可查看更多機(jī)器學(xué)習(xí)庫及其Github地址。


    原文:The Best Machine Learning Libraries In Python(譯者/劉帝偉 審校/劉翔宇 責(zé)編/仲浩)


    譯者簡介: 劉帝偉,中南大學(xué)軟件學(xué)院在讀研究生,關(guān)注機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘及生物信息領(lǐng)域。



      本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
      轉(zhuǎn)藏 分享 獻(xiàn)花(0

      0條評(píng)論

      發(fā)表

      請遵守用戶 評(píng)論公約

      類似文章 更多

      主站蜘蛛池模板: 免费现黄频在线观看国产| 欧美孕妇变态孕交粗暴| 国产SUV精品一区二区88L| 亚洲人成无码WWW久久久| 亚洲人成网站77777在线观看| 亚洲日韩久久综合中文字幕| 久草热8精品视频在线观看| 国产宅男宅女精品A片在线观看| 成人网站WWW污污污网站| 国产精品久久福利新婚之夜| 精品国产乱码久久久久APP下载 | 人人妻人人做人人爽| 亚洲精品日韩在线观看| 久久精品人妻无码一区二区三| 无码专区 人妻系列 在线| 一区二区三区无码高清视频| 国产成人精品午夜福利| 少妇人妻偷人精品系列| 一区二区三区不卡国产| 国产精品无码日韩欧| 人妻少妇偷人精品一区| 久久伊人精品青青草原APP| 99国精品午夜福利视频不卡99| 强奷乱码中文字幕熟女导航| 婷婷色爱区综合五月激情韩国| 国产精品第一二三区久久蜜芽| 久久一日本道色综合久久| 一区二区福利在线视频| 久久久久久伊人高潮影院| 色爱综合激情五月激情| 特级毛片A级毛片免费观看网站 | 亚洲国产精品日韩在线| 97久久天天综合色天天综合色HD| 国产白嫩护士在线播放| 亚洲最大日韩精品一区| 精品久久久久中文字幕日本| 性欧美老人牲交XXXXX视频| 暖暖日本手机免费观看中文 | 精品一区二区中文字幕| 国产欧美一区二区精品久久久| 国产成人一区二区三区视频免费|