長尾經濟改寫了80/20規則,形塑Web2.0的新面貌

語音辨識的技術,有賴蒐集大量語料與統計其中的辭彙頻率。有了統計資料,在音訊模稜兩可時,就可優先考慮高頻詞,提高辨識率。高頻詞稀少,低頻詞眾多,反映常見的「齊普夫法則」(Zipflaw):詞彙的出現比例,幾乎和其排名成反比。根據維基百科,在百萬字布朗語料庫中,最高頻的the 出現6萬9971次,而亞軍季軍的"of"與"to" 分別出現3萬6411次與2萬8852次。第二名出現的次數是第一名次數減半,而第三名則降為三分之一,餘類推。僅僅需要分佈在頭部的前135個高頻詞,就可以涵蓋一般英文文章的半數,而常用2000詞約可涵蓋全文的80%。2000詞之外,形成了長尾(long tail)。由頭部往尾部走,頻率降低,數量暴增,但所佔比例劇跌。對語音研究者而言,要涵蓋越後面的長尾越困難,因為所需的語料越多。

「齊普夫法則」其實有更深一層的意涵。AI學者西蒙舉出「齊普夫法則」反應了發話、受話者間,通訊效率最佳化的最小施力原則。而這樣的原則可以適用到許多的人類行為,普遍的程度令人驚訝。高票房電影,流行歌曲排行榜,都是明顯的例子。如同高頻詞,賣座亞軍的電影,票房大約為冠軍之半,而第三名則降為三成。

電影、唱片、出版食品公司,長久以來又都苦於螢幕、貨架空間不足,只有少數電影、CD、書籍、飲料能夠上線上架。這也難怪公司和消費者,雙方都這麼迷信明星和排行榜。店面空間、傳播頻道時而有限,居首的少數商品既佔交易的大宗,成本效益高,自然值得重視。《連線》雜誌總編輯安德森稱之為「暢銷品經濟」。

2000年前後,資訊科技與Web 2.0時代的網路,卻逐漸改變此現象。亞馬遜網路書店,iTunes音樂店幾乎沒有展示商品的成本。iTunes的50萬首1美元下載歌曲、亞馬遜展示的370萬冊書籍,無論暢銷與否,都佔一樣的硬碟空間,幾乎不需要成本。因此即使不太暢銷的商品,都可在網路商店覓得一席之地,透過網路找到買主。對於有特殊品味的消費者,選擇多樣化當然是好消息。但是對公司而言,長尾的生意,會不會棄之可惜食之無味呢?美國超級連鎖書店Barnes & Nobles受限於空間,只能砍斷尾部,呈列展售約10萬冊。但是安德遜卻發現亞馬遜25%營業額,來自最暢銷的10萬冊之外。在流行歌曲方面,最暢銷的幾首歌曲獨佔鰲頭的現象也漸弱化。總總跡象顯示網路讓供需的尾巴變長了,而iTunes和iPod聯手扼殺了暢銷歌星。

安德遜稱此網路引發的新供需型態為「長尾經濟」,來和以往的「暢銷品經濟」相對應。Web 2.0的網路新興現象,背後都有長尾經濟的影子。全自動的網路廣告刊載流程,與論字廣告的低價策略,讓Google能夠服務無數的小廣告主,造就出50億美元的生意。低價軟體、只租不賣的策略,讓Salesforce.com與策略夥伴的軟體,普及於中小公司,足以和大型軟體公司SAP相庭抗禮。
在安德遜提出長尾經濟的理論之前,其實亞馬遜和Google已在身體力行。2004年Google股票公開上市前,執行長史密特接受《財富》雜誌專訪時說:「Google服務的全球市場,是由很多很多小公司所構成的微型市場聚集而成。微型市場可以聚沙成塔,變成很大很大的市場,想想看全世界的GDP合起來的光景。」

Google Book Search原名Google Print,正在數位化長尾外的長尾-包括圖書館館藏的絕版書,曲高和寡的新舊版權書,提供搜尋與瀏覽的服務。如果讀者想買一冊,Google就轉介到Amazon等網站。當時機成熟時,Google會進而賣起數位書,不管書熱門或冷門。「長尾經濟」不僅是好生意,也凸顯網路民主與多元文化取向。