eMule:見證文件共享萬象更新的十年

大名鼎鼎的非商業開源軟體,全球網友們自由共享資源的工具,「電騾」——eMule已經誕生了10年,至此十周年紀念之際,來自歐洲的物理學家,計算機科學家,同時也是海盜黨成員,eMule mod的作者,為我們回顧了p2p文件共享軟體領域的發展歷史,並闡述了他們的觀點和他們目前的開發方向。
原文成於2012年5月13日,作者:David Xanatos,Ekliptor;翻譯:Ejack。


  2002年5月13日,一個名為eMule(電騾)的文件共享客戶端洋溢著青春的氣息,步入了我們這個共享的世界。光陰荏苒,十年流去,我們願藉此周年之機,回顧一下自eMule問世以來在文件共享應用方面的主要技術成就。我們還將展望未來,看看如何將無所不能的BitTorrent進一步至臻完美,成為不可能被關閉的網路。

  早期如Napster(始於1999年)這樣的主流文件共享應用程序完全是中心化運作的。Napster依靠一台伺服器保存每個用戶所共享的文件,向用戶提供完全集中式的文件搜索功能,甚至用戶之間要開始文件傳輸也需要通過伺服器。這種過分集中的弊端是顯而易見的:當RIAA強制關閉了Napster伺服器之後,Napster很快便銷聲匿跡。

Napster

Napster是p2p文件共享始祖

  幸運的是,此時不那麼中心化的下一代文件共享網路已經開始嶄露頭角。一方面來說,當時已經出現了完全去中心化的文件共享網路,例如Gnutella。這類應用多採用泛洪查詢的方式搜索網路中的其它客戶端,換句話說就是挨個向每一個找到的客戶端發送請求,直到找到足夠多的結果、或者搜索超時才會停止。不過這種網路拓撲雖受益於徹底剝離伺服器,卻也遇到了網路規模難以估量的麻煩。簡而言之,用戶是無法充分有效地搜索整個網路的。另一方面,基於伺服器的eDonkey2000(譯者註:也就是為我們所熟知的「電驢)(始於2000年9月6日)走上了歷史舞台。eDonkey2000與Napster的最大不同之處就是每個人都可以建立自己的eD2k伺服器。這種多個伺服器同時存在的局面雖然意味著不再會因為某台伺服器的關閉而禍及整個網路,但其缺陷也一目了然:用戶只能局限於某一台伺服器搜索和共享文件。該系統與BitTorrent頗有幾分相似:索引伺服器都是系統中的核心機制,需要通過伺服器來查找其它節點。不過,BitTorrent(始於2001年)在這條依賴於索引伺服器的道路上顯然走得更遠:索引伺服器可以控制允許哪些人加入這個群體、每個客戶端可以獲取多少個節點,等等等等……eDonkey2000(eD2k)網路的設計目標則截然不同——他們致力於實現一個完全去中心化並且可估量的網路。依據這種理念,eDonkey2000於2002年5月啟動了一個名為Flock的新項目。經過beta測試後,該項目更名為Overnet,並最終於2004年8月完成了與原始eDonkey2000客戶端的融合。

電驢

電驢-eDonkey開創了新的歷史

  2002年,另一個面貌嶄新且發展迅猛的客戶端也踏入了eD2k網路(eD2k代表eDonkey2000網路中基於伺服器的部分)。這一年的5月13日(也就是距今整整10年前),一個可接入eD2k網路的開源客戶端、也就是我們的壽星eMule正式誕生了。到2004年6月時,整個eD2k網路的規模總計約200萬用戶,其中eDonkey2000的Overnet網路用戶只有約80萬。由此可見eMule是eD2k網路中無與匹敵的客戶端,並在接下來的歲月里開始與BitTorrent並肩霸佔了文件共享領域。

eMule

與電驢不同,eMule是非商業軟體

  BitTorrent與eMule這兩種網路都逐漸轉向了更加去中心化的結構。為了讓每一個用戶都能檢索到所有伺服器上的文件,eMule添加了關鍵字搜索功能,可通過UDP報文對所有伺服器進行查詢;此外還添加了來源交換功能,可通過TCP在客戶端之間交換關於某個文件的來源信息。BitTorrent也吸納了後一種功能,實現了節點交換特性。2004年上半年,eMule引入了Kademlia網路。這是一種去中心化、基於DHT的鍵值存儲表,能夠查找文件來源以及執行關鍵字搜索。這使得eD2k伺服器結束了它的歷史使命。BitTorrent再次跟隨著eMule的腳步前進,於2005年也實現了自己的DHT。

bittorrent

bittorrent後於eMule實現DHT

  在文件共享領域引入DHT無疑是踏出了革命性的一步。說DHT意義重大不僅僅是因為用戶有了文件的哈希值就能夠下載文件(當然,還需要幾個已知節點來引導進這個網路),更重要的是它實現了一個完全去中心化並且可估量的網路。傳統的去中心化網路(如Gnutella)採用泛洪查詢方式查找信息時,需要發送O(n)條請求;而DHT查找相同規模的信息只需要發送O(log2(n))條請求。當網路的規模擴大一倍之後,查找整個網路所需的請求數目一般來說也只需要多1條,不論網路的實際規模到何等天文數字也是如此。下面我們舉例說明這種結構的好處:假設有個擁有200萬用戶的網路,你期望在這個網路中找到關於某個文件的信息,而且很不幸的是這個文件並不存在於這個網路中(也就是說,在這個網路中無人共享此文件)。如果走泛洪查詢的路子,我們就必須挨個問到網路中的每一個用戶,之後才能知道這個文件並不存在。當然,實際這樣的搜索過程通常會進入超時,但我們只能估計(並不能確定)這個文件並不存在。而藉助神奇的DHT,你只需要向21個節點(log2(2000000))進行查詢,就能確知這個文件並不存在於整個網路中。而且這只是數學上最差的搜索情況。一般來說實際所需的查詢數目將會遠遠低於這個最大值,因為在你的查找路徑上也許只需要3到4次請求(這是目前eMule的Kademlia實際搜索的經驗數據)就可以找到最接近於你所需要的文件的節點。

p2p網路

去中心化是技術對自由的追求和嚮往

  我們認為BitTorrent所應當引進的下一個功能就是真正基於DHT的關鍵字搜索功能。Tribler這款客戶端已經在這個方向上進行了一些嘗試。不過,他們的種子被散播到了一些其它的知名客戶端,導致搜索結果難以估量。大家都知道,海盜灣在只支持磁力鏈接後,其種子庫的總大小只有約90MB。不妨設想這90MB完全實現分散式存儲後的情況:在一個百萬規模的網路中,每個節點只需保存數百kB的分散式數據,就足以保障每個種子都在網路中有數以千計的副本。這樣,即使有非常多的節點並不在線,也足以確保用戶找到所有的種子。不幸的是,之前所有去中心化的共享搜索功能都不可避免地遇到同一個棘手問題:垃圾信息。在這一點上我們eMule開發人員應當學習Torrent的社區化——像海盜灣這樣的網站可以擔負起甄別的責任,為用戶提供可信的搜索結果。如果他們(海盜灣)能夠繼續承擔甄別種子質量的責任,那麼不妨通過公鑰加密來對種子簽署認證,這樣就可以實現不受任何垃圾信息侵襲、而又完全去中心化的搜索。如果一個用戶充分信任某個種子站點,他完全可以將該站點的公鑰添加到Torrent客戶端中,這樣客戶端就可以檢查搜索到的每個種子的數字簽名,並過濾掉所有的虛假結果。如果未來能夠按照這種完全去中心化的方式發展,那麼一個像海盜灣這等規模的種子站點將只需要一台普配的筆記本便足矣。這台「伺服器」只需每隔幾小時接入互聯網,採用其私鑰為種子簽署認證。不妨想想在這種情況下,想要跟蹤這樣一個「種子站點」將是多麼困難的事兒。於是幾無可能輕易關掉種子站點了。

  我們現在正從事開發一款客戶端,將會提供上述搜索種子的功能。目前該軟體還處於封閉alpha測試階段,即將進入beta公測。

關於本文作者
  David Xanatos是奧地利盜版黨(也譯作:海盜黨)的建黨成員之一,現居於維也納,白天任職於某大學教授物理,晚上則開發各種文件共享應用軟體。David Xanatos因他的得意作品NeoMule而廣為人知。
  Ekliptor是位計算機科學家,來自慕尼黑。他曾開發過多款eMule Mod,目前在大學中致力研究eMule的Kademlia系統所存在的缺陷以及解決辦法。
  他們二人目前合作的項目名為「Neoloader」。這款客戶端能夠從BitTorrent、eMule以及各種一鍵下載鏈接(如RapidShare)中下載文件。

原文:《eMule: A Decade of File-Sharing Innovations
譯文:《eMule:見證文件共享萬象更新的十年》作者:Ejack
轉載請註明。

44條評論隱藏

  1. #1 Handsome
    2012年5月18日 周五 10:40 | 回復

    看前面介紹海盜黨成員。還以為是海盜灣呢 :mrgreen:

  2. #2 kio
    2012年5月18日 周五 11:26 | 回復

    @Handsome 海盜黨就是盜版黨的另一種翻譯叫法

  3. 2012年5月18日 周五 18:41 | 回復

    話說我現在基本不用emule下載了,花點小錢用渣雷離線省心。但我網路空閑時還是會打開xtreme,只用來上傳。

  4. #4 kalyrenyaren
    2012年5月18日 周五 19:05 | 回復

    @小野 那個是因為你下載的不是稀缺資源。不然渣雷根本拖不完的。

  5. #5 Pale_Cheung
    2012年5月18日 周五 20:34 | 回復

    很期待 能 同時 同 ed2k 和 torrent 網路下載的客戶端。

    訓練離線確實對稀有資源無力。

    但是他是在中國上下行現在是差到一個數量級以上的網路環境下,發展得有滋有味的,心裡真舒服。

  6. #6 zwgzwg12
    2012年5月18日 周五 22:12 | 回復

    「Neoloader」,期待中

  7. #7 FoxCyy
    2012年5月21日 周一 11:53 | 回復

    迅雷用戶前來祝賀並開始使用電騾! 😀

  8. #8 cftiger
    2012年5月24日 周四 00:09 | 回復

    ed2k 和 torrent 同時下載的客戶端目前 bitcomet 配合 emule 插件就可以。下稀有源的只要找到種子,ed2k 又有源的,我就用 bitcomet 下。
    的確,目前emule就只用來下稀有源的和共享之用了(只共享稀有源)。若非 ed2k 有那麼多稀有源,也許也不用 emule 了。
    吐槽一下其不足。現硬體和網速都如此強了,其搜索設定仍太保守,搜源能力極差。本來手動連接彌補其不足,但又限制連接次數(不知是每幾分鐘一次。我知道源的ip和埠,就是死活手動連不上)。下載抗干擾能力差(不管是網路環境還是系統環境),在天朝這種垃圾網路環境下,經常下幾百K又要重新排隊,還經常給個「隊列滿了」給你(我可以百分百肯定隊列未滿)。
    總結一句就是老掉牙的老太爺,真的適合歐洲人用。
    當然其最大優勢是不用發布,不用種子。若BT軟體以後整合磁鏈搜索功能,則它連這種優勢都沒有了。

  9. #9 peng
    2012年5月24日 周四 09:05 | 回復

    @cftiger 那是因為中國的迅雷之流,離線下載之類造成的。國外可沒有這些鬼東西。你說emule搜源能力差和連接不上也只是在中國的情況,國外伺服器因為中國出的「種子搜索神器」,所以伺服器早就禁止中國人搜索了,甚至屏蔽中國人的加密連接,再加上牆的封鎖,所以你說的問題都是中國人自作孽的結果。至於能搜索文件的BT,你可以用vuze,國外很多人都用。
    另外你自己也說了你用emule看中的是稀有資源,那你想想為何emule有稀有資源,其他沒有呢?

  10. #10 share
    2012年5月25日 周五 18:08 | 回復

    太好了,emule和bt強強聯手,編寫自由的歌章

  11. #11 cftiger
    2012年5月27日 周日 13:56 | 回復

    其實emule搜源能力不差,是連源能力差。當你點開始下載後,它通常會搜到源,但就是連不上,主要是其預設太保守,不能重複連接。即使你知道源的ip和埠,由於它已經連過一次了,所以連你手動連接也不允許,要等N分鐘後(想快點可以關了emule重開)。這種情況bt好多了。
    還有種情況是,連上了,就是沒有下載,整天就是排隊,排隊。當你排到個位數,以為下一個就到你了,它卻又變回「隊列已滿」或幾千。這種情況bt也有。
    由於它下載經常沒有達到一塊9.28M大小,當你導入文件塊時,他會把那些已下但沒達整塊的碎塊清0。
    沒有打開程序時開始下載或不開始下載,結果emule崩潰後,如果裡面有一大堆下載,你重新運行emule後,這N個下載會同時開始,由於連接數太多,這時連伺服器就會給個LowId給你,還有就是由於沒連伺服器前就開始下載,所以搜到的源數都較少。
    還有,你的highid或lowid是由你是否連接了伺服器決定,而不是由外網內網。大家知道lowid和lowid是不能互連的,那那個「不用伺服器也能下載」幾乎成了廢話。如果emule不改進,有一天所有的伺服器都關閉後,一樣死翹翹。
    用下載能力差的emule來下載源少的資源,就是名副其實的老牛拉破車。
    最近下稀有資料老是下不完整,故來發泄一下。
    emule稀有源多,一是它以共享軟體的名義,默認共享是打開的。而有的軟體考慮到安全性沒打開。隱患真存在,你輸入「密碼」,「日記」,一搜一大堆,我還曾搜到一個某局長的日記,不過沒什麼關鍵東東。連我這個老鳥有次也不小心把密碼文件共享了幾天才發現,不得不把所有密碼都改過。
    二是像我一樣共享精神的共享了一大堆稀有源。為什麼選下載能力不強的emule共享稀有源?習慣了,同時也就扎個堆。

  12. #12 hhh
    2012年5月27日 周日 14:09 | 回復

    @cftiger 手動重複連接(或關了emule重開)的話可能會遭到這個待遇:https://www.emulefans.com/aggressive-client-ban/

  13. #13 hhh
    2012年5月27日 周日 14:19 | 回復

    @cftiger

    那個「不用伺服器也能下載」幾乎成了廢話。

    請教那麼多只用KAD的人比如說我是怎麼用的?我現在已經不連伺服器了,除非我想使用ed2k搜索時。

    一是它以共享軟體的名義,默認共享是打開的。

    默認共享的只有temp中未完成文件和emule的incoming文件夾,真不知道你的默認共享的是什麼?還是你用了一些不懷好意的人修改的mod?

    看了上面你所有的觀點,我覺得你不是老鳥,而只是用了較久的「新人」。因為很多概念和機制你都沒搞清楚,而加入了自己的猜測和理解。

  14. #14 hhh
    2012年5月27日 周日 14:25 | 回復

    @cftiger

    用下載能力差的emule來下載源少的資源,就是名副其實的老牛拉破車

    源少也怪emule?emule也沒辦法變出來哪怕一個人來共享你需要的資源呀。

  15. #15 cftiger
    2012年5月27日 周日 14:30 | 回復

    上面那位老兄提到的連接問題。很多國人以為網路分割只有天朝有。其實外國一樣有,不同isp連接不上在外國一樣存在。現在天朝好像不止不同isp分割,不同ip段也分割。有時我發現同一isp同一地區即使連接上了,就是下載不了,換一個ip段就好了。
    其實emule下載能力相對bt差,最大一個原因就是其連接次數預設值太保守,都是N分鐘內只能連接一次。bt則好多了,一次連不上,很快就第二次連接。正是其連接能力相對較弱,造成很多富餘的上傳帶寬。如我emule設定的上傳帶寬就常常用不滿。
    vuze主要是美劇,中文資源幾乎沒有。

  16. #16 cftiger
    2012年5月27日 周日 14:43 | 回復

    @hhh
    「這種行為會是對寶貴資源的極大浪費(連接和帶寬)」現在的帶寬,連接數,計算能力還是十年前嗎?請求一次連接要帶寬多少,系統的連接數還是十次嗎?10分鐘一次是不是太長了。
    我所說的「默認共享」是指只要軟體打開,你原來共享的文件就會被共享,bt則不同,每次都要手動打開。

  17. #17 cftiger
    2012年5月27日 周日 14:58 | 回復

    @hhh
    你不連伺服器還能下載,那只是因為還有很多其他人連接了伺服器獲得了 highid,若所有伺服器都被 FBI 關閉後,你還能下載那才說明你 NB。我就一直奇怪,emule 判斷 high,lowid 不是根據你的埠是否能到達,二是要連接伺服器來判斷。

  18. #18 cftiger
    2012年5月27日 周日 15:14 | 回復

    上面提到的也只是我想到的,還有不少缺點一時想不起來。不得不說歐洲人的東東相當保守。
    新手看到上面那些批評,請不要就放棄emule,我都是希望它能夠改進的(聽到說emule開發進度要減慢,相當遺憾)。作為共享軟體而不是下載軟體,它目前來說還是最強大的。所以我目前把所有途徑下載來的稀有資源都放到裡面共享了。但它不會是我首選的下載軟體。

  19. 2012年5月28日 周一 02:07 | 回復

    看到好消息了,

  20. #20 怒火天尊
    2012年5月30日 周三 22:48 | 回復

    其實 迅雷為中國人作的貢獻也很大

  21. #21 syc
    2012年5月31日 周四 08:37 | 回復

    是你們貢獻很多給迅雷xd 迅雷賺你們白花花的鈔票….

  22. #22 hagoubang
    2012年5月31日 周四 09:09 | 回復

    @怒火天尊 還幫助有關部門抓過人對國家貢獻很大。小青年們如果喜歡就繼續用迅雷吧,在迅雷面前你們都是裸露的,下得什麼A片B片上面都好備案。

  23. 2012年6月1日 周五 15:59 | 回復

    渣雷當道
    騾子在國內步履蹣跚啊……

    電騾資源下載網站

  24. #24 throll
    2012年6月1日 周五 22:09 | 回復

    @cftiger
    1.emule尋蒐能力,連結能力只能說在天朝請自動打八折,外有不少client or server有加載china ip filter,內有景德鎮和無良isp,你就認命吧
    2.bt的暴力連接要求可是曾經讓海盜灣都要投降放棄,十年前雖然網路沒這麼發達,但人數沒這麼多,況且p2p的問題通常不是在頻寬而在session承受能力
    3.emule的連接請求在排隊時就代表已經確認連接,想要快速建立可連接數請在選項設定,當然前題是真的有這麼多客戶端,至於bt/em 在下載的連接/優先權機制不太一樣,不停的像bt發送連接請求只會落得被ban的下場
    4.kad的hight or low id跟server id無必然關聯性,kad一開始設計目的就是在無server下運作的,當然有連server的狀況下,kad表建立會比較快
    5.正規mod可分享的資料夾和暫存檔是可設定的,把重要資料丟進去那…我也沒辦法

  25. #25 Eli4ph
    2012年6月3日 周日 10:52 | 回復

    @cftiger 把全部評論看了一下,發現你對emule相關的設置以及運作有一定的了解,但是許多概念或者機制理解有偏差,如24樓兄台所說,KAD表的建立在連伺服器的情況下會比較快,沒連時就要慢許多,所以只要你一直掛機應該就不會有差異了(emule本來就特彆強調穩定性長時間掛機的,掛個一年半載再關機的人也不是沒有)。另外,關於一些可以實現單emule沒有實現的功能,有些是官方明確不會添加的,但沒說不能添加,所以假如你有能力的話,可以自己做個MOD。第三,關於你說的個人隱私被泄露,我覺得是你的文件管理有些亂,本來個人密碼這種隱私極強的東西就不應該和分享的稀有資源放在一起的。(再稀有也不及你隱私重要吧?)第四,既然你說你會共享一些稀有源,你也知道在天朝,搜索很不實用,建議你把生成的ED2K鏈接貼到網站上,現在ED2K地址分享的網站有許多,你隨手貼幾個網站就OK了,也許貼鏈接會讓你覺得麻煩,但是我想你也是本著分享的心的,稍微花一些時間,可以讓資源更好地流通,你可以酌情考慮一下這個建議

  26. #26 Eli4ph
    2012年6月3日 周日 10:55 | 回復

    @throll 兄台請教下,emule的config文件夾裡的nodes.dat假如沒有可以建立KAD表麼?

  27. #27 kalyrenyaren
    2012年6月3日 周日 13:53 | 回復

    @Eli4ph
    kad就是根據node.dat裡面的節點開始搜索的,沒有當然不可以。

  28. 2012年6月6日 周三 10:53 | 回復

    海盜黨就是盜版黨的另一種翻譯叫法

  29. 2012年6月7日 周四 21:44 | 回復

    九九回來這裡就看到10年的生日慶賀!一同來祝福騾子可以長長久久….
    想想我騎騾也騎了9年多了啊….(遠目

  30. 2012年6月7日 周四 21:44 | 回復

    @風之水 錯字啦…久久

  31. #31 Jurio
    2012年6月12日 周二 18:18 | 回復

    無論emule的kad還是bt的dht都只能作為輔助,沒有核心伺服器(bt的tracker伺服器)都無法正常工作。em bt協議都屬於十年前的老技術了,缺陷很多。em bt都是暴露ip的軟體,isp和警方很容易知道你上傳下載了什麼文件,國外被抓的有很多。bt大行其道是因為西方法律無法禁止,但是在美國em就沒人用,估計就是法律問題。

  32. #32 Jurio
    2012年6月12日 周二 18:28 | 回復

    去中心化P2P是發展趨勢。不過Gnutella也屬於落後的技術。Gnutella網路必須通過網站引導,搜索可用的超對等點葉,Gnutella不是真正的無中心P2P。真正無中心P2P還是日本的P2P:share、perfect dark。日本版權保護非常嚴格,使用暴露ip的bt em很容易被抓。開發出來的專用P2P軟體不僅絕對無中心,還能實現匿名通訊,完全無法被偵測。這是次世代的P2P,如果西方版權法律也和日本一樣嚴格,肯定也會這樣發展。正因為大部分國家法律允許,所以全球才會以伺服器為中心的P2P最為普及。bt甚至發展成完全取消dht,只能用私人tracker伺服器的PT模式,目前PT網站最火。

  33. 2012年6月12日 周二 18:54 | 回復

    @Jurio 所以使用的時後還要多加上IP過濾,過濾掉有問題的釣魚伺服器,也就是所謂的蜜罐。
    還有有問題的IP端,IP過濾都有賴於大家的更新。
    (當然也可以過濾掉渣雷的離線IP機房…呵呵)

  34. #34 foops
    2012年6月12日 周二 21:40 | 回復

    @Jurio 美國法律共享盜版就犯法,即使不發生上傳。所以emule敢用的人少。

  35. 2012年6月15日 周五 15:48 | 回復

    據說下一代去中心化大牛是 磁力鏈……

  36. #36 kaweri
    2012年6月15日 周五 17:41 | 回復

    @電騾資源 什麼下一代,磁力鏈就是電驢鏈接的變種,也就國人無知才把很老的東西以為是新鮮玩意兒,可以看wiki百科:http://en.wikipedia.org/wiki/Magnet_URI_scheme

    The standard was developed in 2002, partly as a “vendor- and project-neutral generalization” of the ed2k: and freenet: URI schemes used by eDonkey2000 and Freenet,

  37. #37 四足獸
    2012年7月21日 周六 16:23 | 回復

    我也有了一種數學證明方法,關於「DHT查找相同規模的信息只需要發送O(log2(n))條請求」。

    搭建在KAD網路上的個人簡易blog是有可能實現的。這可免於網站備案;免於某防火牆的騷擾;免於搭建私人blog的硬體,帶寬開銷;免於商業blog的廣告佔用帶寬。

    這種blog訪問量再大,也不必擔心阻塞。甚至此節點下線,簡易blog也能被訪問,因為臨近節點有內容緩存。「KAD節點如果因為帶寬不夠,造成查詢阻塞,就會自動由臨近節點為此節點加速。加速節點根據需要,可以自動增加或減少」早已實現。

    商業網站為了節省帶寬,大多不提供原始尺寸照片存儲。KAD簡易blog默認只顯示縮略圖,訪問者也能更進一步瀏覽中間大小的jpg圖片,如果覺得圖片優美,可以下載原始尺寸的。為了防低質量圖片泛濫,所有blog圖片默認不加入KAD共享,下載量達到一定數量的原始尺寸圖片,才默認自動hash計算,加入全網共享。

    為了快速內容緩存,當IP改變後,自動通知臨近節點。

    為了避免用近似關鍵字搜索blog的不便,(自願)設置每篇blog內容屬性時,強制使用規範的關鍵字。客戶端自帶全部關鍵字:哲學(現象學,結構主義,解構主義,分析哲學……插一句,我是西方哲學愛好者),人類學(體質人類學,文化人類學),神學,考古學,文學,平面藝術,攝影,古典音樂……

    盡量借鑒wikipedia的優點。用戶可以設置日記的編輯許可權,允許第三方修改(以不同的字體顯示)。減少了網頁里常見的長長的,讓人頭暈的跟貼,回復。與wikipedia不同的是,對盜版內容寬容。

    如果沒人願意做這事,那就由我開始。可我不會編程,以前學的c語言早忘了。擴展emule最少需要哪些編程知識?哪些開發工具?請指點

  38. #38 slash
    2012年7月23日 周一 13:07 | 回復

    @四足獸 想法很好

    但現在免費的、大容量的、直鏈的、可定製的、完全無廣告的網上存儲和blog服務早已出現,像Dropbox和WordPress.com。所以你說的免於搭建私人blog的硬體,帶寬開銷;免於商業blog的廣告佔用帶寬,等等問題,都不存在。存在的只有版權問題

    國內比較特殊,假如能有基於P2P的blog,能解決除了版權問題之外的更多問題,在國內更有用。但問題是,由於大陸用戶比較白痴,網路生態較差,不會有多少人來用這種玩意。沒有用戶群也搞不出聲音來

    blog搬到KAD上也排除了搜索引擎的收錄,這應該是普通文字blog的第一流量來源吧。再則P2P的blog,穩定性也不夠

    不過雖然有這些種種麻煩,但至少在技術上,還是值得一試,看起來這還是挺新穎挺有趣的

  39. #39 slash
    2012年7月23日 周一 13:09 | 回復

    @四足獸 至少先要把C++和網路知識弄透吧,工具不成問題,肚子里的貨才最重要

  40. #40 四足獸
    2012年7月27日 周五 18:54 | 回復

    @slash

    謝謝鼓勵。
    我主要是為了解決某防火牆的騷擾。不同於西廂方案。讓每個人都用代理伺服器,開銷太大。
    即使能實現p2p的blog,我也沒打算讓非常多的人用。用戶群越多,蛻化得越厲害。早期豆瓣的文字水平,遠不是現在的豆瓣能匹敵。

  41. #41 swift
    2012年8月1日 周三 07:17 | 回復
  42. #42 四足獸
    2012年8月12日 周日 11:12 | 回復

    p2p博客內容不被搜索引擎索引的確是大缺點,但也擺脫了搜索引擎的弊端。在這種blog里,有個鮮明的特徵:站內文章搜索排名只依據內容深度,不依據瀏覽量或粗放的推薦次數(這常常導致膚淺無益的流行)。一般來說,文章越深入透徹,理解文章所花費的時間越長。所以那些瀏覽時間越長的文章排名靠前。但閱讀時間長的文章可能冗長,見解貧乏。引入變數:閱讀時間/字元數。這個比值越大,排名越靠前。

    無效統計數據必須清除。如果頁面是其知識範圍以外的,或者是外語文本,他可能匆匆一瞥就跳過去,這不能斷定文本質量低劣;如果因為某事暫時離開,頁面會被機器認為閱讀了很長時間。

    棘手的是,新手與老手在領會同一個知識範圍內的文本,所需時間相差很大。給站內搜索排名造成很大的波動。站內搜索結果還需多級修正。

    如果其它mod篡改這種搜索排名核心原則,那麼搜索排名將變得混亂不堪,毫無價值。最頭疼的是人為設立的惡意客戶端。它力圖破壞p2p博客。僅僅用ipfilter是非常不夠的(它的實力遠非迅雷能匹敵,ipfilter可能會變得異常龐大)。它如果使用動態ip進行擾亂,那麼記下對方的hash,ip地址,埠。2小時後照此ip發起訪問,詢問對方hash,如果得到答覆且hash匹配,則初步認為此次訪問可信。

    為了加快響應,只在某hash24小時內第一次瀏覽blog時,暫停全部文件的上傳/下載,讓出帶寬。這是為了防止惡意點擊blog。p2p網路功能越多,破壞手段也越多。

    儘管我希望找到問題的應對辦法,但更希望得到批評:那些我沒注意到的問題。

    搜索引擎按引用次數(喧囂翻騰的主流人群)給搜索結果排序。可是哲學家們也需要觀察思想中的暗流,最無人過問,最無人理會之處。搜索引擎恰恰對哲學家們關上了這扇大門。

    商業搜索引擎不會以內容深度為核心排名規則。搜索出的結果註定只有少數人感興趣。商業搜索引擎力圖讓最大多數人使用,最大限度地展示廣告。搜索引擎引以為傲的是「精準」,可是作為個體的人,真正需要的是什麼?連他本人都難於回答。

    一部分人可能回答「是愛情」。可愛情是有害的,它會極大地消解反抗政治/種族壓迫的意願。各種土政策就是活生生的壓迫。對抗這些土政策不僅是可能的,而且每天都在發生。如果不是因為土政策的失效,權力不會有任何改寫土政策的意願。

    在哲學家那裡,每種價值都已然是問題。

  43. #43 Ejack
    2012年8月13日 周一 06:59 | 回復

    @四足獸
    非常好的想法。
    博客質量的評判,已經牽涉到人類主觀意識的問題。任何單方面的數字評估恐怕都是不全面的。相對閱讀時間較長就一定表明博客質量很高嗎?有些博主喜用艱深晦澀的文字;有些推理作品本身就需要讀者反覆閱讀在字裡行間追索蛛絲馬跡;單一的標準總會傾向於對某類作品有利,不可不察。
    我們所能做到的,恐怕仍然只有統計出最流行的、最受歡迎的作品。它們有可能是非常優秀的,也有可能是迎合讀者口味的。
    真正有價值的作品,如同埋在沙礫中的黃金,終須一日被人挖掘才能為人所知——一如過去、現在、未來的任何一個「今天」。

  44. #44 諸神黃昏
    2012年10月17日 周三 22:54 | 回復

    @cftiger 多說無益,emule,BT BAN!想用渣星吸我們?!作夢呢!在ZB連BT也一併ban掉渣星.反正渣星就是渣,沒什麼有價值的玩意,連渣雷都不如的垃圾.

1條Trackback/Pingback顯示

發表評論

您的Email將不會顯示出來。頭像請至Gravatar.com註冊上傳。*號標註項為必填。

*
*
*
標籤用法
字數:0