![]() 2022-02-09 18:40 談談信息挖掘本文來自微信公眾號:caoz的夢囈(ID:caozsay),作者:caozsay,題圖來自:《超體》 眾所周知,TK教主是搜索引證的達人,在技術高手的成長路線里,善于使用搜索引擎一定是最基本的能力訴求。 舊文也多次提過,有價值的信息往往碎片化,往往如面包屑隱藏在不同角落里,如何搜索,整理,判斷,歸納,就顯得尤為重要。 而信息越完整,關鍵決策的支持也就越完整,決策的準確性也就越高。 那么到底,怎樣才算是信息挖掘? 前幾天,我直播的時候,拿自己的習慣做了一個案例,但不知道什么原因,被系統以異常為由終止了直播。 友情提醒,本文所有內容僅為信息挖掘案例展示,不作為任何投資決策建議。 案例: 最近好奇大阪的房產投資,所以做了一些功課,跟大家分享一下我的信息采集和整理的思路。 第一,為什么考察大阪。 1. 相對于東京而言,大阪的房價只有1/3到1/2,但作為關西最大城市,以及熱門旅游目標,其出租回報和東京的差距并沒有房價那么懸殊。整體出租回報率,從表面來看,非常可觀。該部分后續再展開。 2. 新加坡的銀行可以為客戶購買大阪房產提供貸款,并且有一定利率優勢。 3. 日本法律相對規范,代理機構相對可信任,政局相對穩定,相對于東南亞地區的一些新興小國,長期風險相對可控。 4. 疫情期間,有一定的低估價值,疫情結束后,存在報復性旅游的可能性。除了中國游客外,無論是東南亞游客,還是歐美游客,都有非常多人熱衷于大阪旅游。 這里,1和2屬于基本信息的采集,其中存在一定的道聽途說,需要進一步的核對和驗證。而3和4屬于基本認知和常識。當然,有人如果不承認這是常識,沒關系,此部分僅作案例完整性陳述使用,不爭論。 第二,如何搜索房源。 搜索海外資源,默認谷歌。 如果用中文搜索,多半會發現一個中文日本房產平臺,那么用英文搜索,也會找到一些當地的房產網站,但這些是否是最完整的呢? 換一種搜索方式,搜索“日本最大的房產網站”,找到一些討論是suumo。不過是全日文的,也就是正常情況下我們是搜索不到的,那么全日文網站能不能使用,當然能,因為有“谷歌翻譯”,在Chrome瀏覽器右鍵即可全站翻譯。基本內容理解起來是沒有問題的。 對比房源,確實比中文平臺內容充實。 不同平臺的房源有些是重復的,但有些也是各自平臺獨有的。 第三,關于信息深挖。 找到了房源信息,價格,地段,面積,是不是就可以做出足夠的對比了,這僅僅是開始。 這里補充一句,關于房產持有的稅費,很容易搜索到,屬于基本信息,不贅述。 3.1 搜索不同城區的房價對比和區域特征對比。 紅燈區房價相對很低,治安也相對較差,流浪漢多。北區是新發展區,金融中心和信息產業。 大阪大學所在是北部。東區外國人較多。 中央區,浪速區,天王寺區屬于傳統旅游和商業區域,游客較為集中,等等。 以上,搜索“大阪城區房價對比”,能找到不少。 3.2 不同區域人群構成和政治傾向構成。 非常有意思,我還查了“大阪特區公投”的傾向性分布圖,這個有一定代表性,可以了解不同區域主要居民,是偏向革新,還是偏向保守,那么這也會多少影響到該區域未來的發展活力。 3.3 不同區域的房租對比。 房價對比和房租對比,可以更好的理解租售回報的比例。 這些是基本信息,也是很多人可以想到的,但這些足夠了么? 并不夠,其實房源信息里提及的很多關鍵詞,要有好奇心,那么基于這些關鍵詞,繼續深挖,就會看到更多有價值的信息。 比如某些房源價格明顯低于同地區行情價,那么通常都是有原因的。 3.4 所謂土地類型和最高容積率。 發現有第一類居住區,第二類居住區,商業區,工業區等等。 那么第一類是低密度優質住宅區,第二類就普通一些,是不是第一類住宅區更好呢,未必。因為這種地塊商業配套往往不夠好。如果不是自住,而是出租給游客和普通人,可能不如第二類居住區方便。 商業區可以有更高的容積率,可以開店鋪,通常價值更高,但是仔細閱讀條款其實是有風險的,居住區的采光權是有一定保障的,但是商業區就不是了,所以如果不仔細調查周邊,有可能是被高樓包圍,暗無天日的地塊。 3.5 所謂建筑許可。 防火區域,半防火區域,這個和普通區域區別在哪里。 日本一戶建大部分是木造結構,成本較低,但是防火區域就不允許木造結構,只能做鋼混結構,那么建造和改建成本都會比木造高很多。 再建筑許可。有些老房子是禁止再建的,因為不符合新的建造法,可能這種地塊后續維護就比較煩,雖然也允許翻新,保留主體結構即可,但畢竟不能為所欲為的改造房產,特別是這種都是很老的結構,所以這種往往價格顯著低于市場價。 3.6 谷歌衛星和谷歌街景。 看到房源信息和所在區域,要查看地圖周邊,那么谷歌街景和谷歌衛星其實是價值是非常巨大的。你只看地圖,可能大概知道這個房產的位置和區域,但是街景可以看到周邊的真實情況,比如前面提到的,采光,以及是否可能存在較多噪音污染。 還有很重要的一點,我也看到一些顯著低于市價的市中心區域房源,那么用衛星地圖和街景才注意到,背后是一些神社,而里面則是密密麻麻的墓地。換句話說,這個房子是無遮墳景房,這種你從公開的信息圖片是看不到的,如果無法去現場考察,或者現場無法深度調查(比如只允許在前面參觀,以租客的名義不允許進入內部查看視野),那么谷歌衛星非常有用的。 3.7 民宿許可。 大阪允許全年民宿營業,但這里有一個問題,所謂允許,其實是需要鄰里同意才可以,而大部分公寓是禁止民宿進入的。 所謂許可,只代表該區域許可,不一定代表該房源許可。 3.8 城市發展規劃和重點校區分布。 政府官方網站和官方報告其實是最直接的資源,當然,還是需要谷歌翻譯。 以上這些,都是通過房源信息內容展示中不同的關鍵詞,那么基于這些關鍵詞不斷組合搜索挖掘出來的。 當然,在搜索之后,可以再聯系會中文的中介,對不明確的信息進行進一步的咨詢,這時候,問出來的問題就會顯得相對專業,別人也會認為你確實有足夠的準備,當然也會認真對待你的問題。 3.9 其他。 比如說,日常維護和管理的成本,代管費用,比如說,出租市場的行情,當你覺得出租回報率很好的時候,別忽視潛在的空租率。 這些可以通過進一步溝通深度了解,而且可以多咨詢不同的中介,互相印證。 今天啰嗦這些,回到最初話題,是不是說鼓勵大家投資房產,絕對不是。 我舊文《關于海外置業,我潑點冷水》有提到。 今天的主題是,如何進行信息挖掘。 第一,好奇心很重要,你對某個領域有好奇,是驅動你深挖的動力源泉。 第二,學會尋找最有價值的信息源。信息源很重要,很多時候,有價值的信息存在于垂直領域的搜索平臺里,你要先找到這個平臺。 第三,對關鍵詞敏感,瀏覽領域內文章,領域內信息的時候,看到有些關鍵詞不是很理解,不是很明確,要去搜索確認。 這點極為關鍵,往往可以通過一個信息點,查閱的過程中不斷發現新的關鍵詞,不斷擴展信息點,最后會成為很龐雜的知識樹。 我舊文經常會留有一些面包屑,也就是某些關鍵詞特征,有極少數的人可以通過自行搜索,拼湊出更多的豐富內容。也有人會說,我搜過了,找不到,其實很多是需要一些關鍵詞組合,有些是內容提到的,有些可能需要腦補一下。比如你搜索什么領域的,那么特征關鍵詞+領域標記詞,可以很好地限定搜索范圍,這本來應該是很常識的東西,但確實很多人并不擅長。 第四,多渠道信息比對,確定信息真偽,來源和完整性。有時候,某些渠道的信息不完整,可以通過識圖搜索,或者其他關鍵詞組合方式尋找其他渠道的同一信息,相互對照補充。 第五,建立信息之間彼此關聯的邏輯。 比如前文所述,不同授權區域,不同建筑許可,不同周邊環境對房價的影響因素等等。要建立一個關聯影響的框架邏輯。 第六,必要的時候,尋求專業人士的見解。 前提是,做足功課。 你做足功課,別人也會重視你的咨詢,比如前文所述,一個中介面對一個做足功課的咨詢者,一定會認為對方有足夠的交易意愿,當然會更積極的回復和交流。而且當發現對方有足夠的信息儲備,自然也不敢過于夸大其詞。 互聯網信息往往是碎片化的,那么你首先要明確,自己所期望的目標是什么,并建立最基本的目標邏輯框架。 比如房產投資,追求租金回報和追求升值,其底層邏輯是完全不同的,其所需要關注的信息重點也是完全不同的。 基本目標邏輯確認后,再根據所收集的信息,將各種影響及關聯因素盡可能羅列,并且對每個影響因素的影響范圍盡可能標注,并通過進一步的信息采集去修訂。 當我們試圖做出一些關鍵決策的時候,這些信息越完整,因素關系越清晰,對決策的效率越有意義。 《數據控新加坡買車記》,這也是一個范例,決策前的數據準備和信息挖掘。當時我勸身邊朋友說,根據歷史數據,COE會大漲,但是都沒聽我的,后來疫情特殊原因還下跌了一段時間,但很快就飆升了,從當時的推算邏輯來說,我的預判是沒有問題的,疫情是個黑天鵝事件,僅僅是短時間影響。 做出重大決策、關鍵決策的時候,信息挖掘和采集都是非常重要的。然而現實中,很多人會一時頭腦發熱做出關鍵決策。此外,盲從所謂權威意見也是很危險的,甚至很多權威就是靠收割來實現其權威價值的。 最后,補充一句,以上案例所提到的信息采集,并不足以建立真正有效的決策支持。信息不對稱所帶來的風險依然存在。此外,世界多變,諸多黑天鵝因素會嚴重干擾決策效果。 本文來自微信公眾號:caoz的夢囈(ID:caozsay),作者:caozsay 本內容為作者獨立觀點,不代表虎嗅立場,授權事宜請聯系hezuo@huxiu.com 如對本稿件有異議或投訴,請聯系tougao@huxiu.com 正在改變與想要改變世界的人,都在 虎嗅APP |
|