幫助百度讀中文 消滅所有廣告和競價排名結果的UserScript腳本 更新v0.7

baidu不懂中文

有人說百度(baidu)讀中文的能力強於Google(谷歌)等其他搜索引擎,筆者深不以為然。截止北京時間2009年6月27日,百度依然無法閱讀頁面鏈接中出現的中文,搜索到的頁面鏈接有中文的話,搜索結果下方的鏈接中顯示為亂碼。而Google等一些搜索引擎不但顯示正確,而且還能給鏈接中帶有中文關鍵詞的頁面加權重。為了讓百度會讀中文,這裡筆者寫了一個《幫助百度讀中文》用戶腳本。

注意:由於事務繁忙,該腳本現在已不再進行維護,也有可能不再適用於最新的baidu搜索頁。本人以GPL v3協議發布該腳本,您可以對其修改後進行再使用。本人建議您使用Google.comGoogle.com.hkYahoo.com等更為專業的搜索引擎。

《幫助百度讀中文》用戶腳本的功能有:

  1. 能夠更好地幫助百度閱讀鏈接中出現的中文(不限於中文字,理論上是所有CJK漢字,乃至於所有文字),消滅亂碼,讓它顯示正確;
  2. 消滅百度右欄的諸多廣告,右欄僅保留關鍵詞的貼吧鏈接提示;
  3. 消滅百度搜索結果中濫竽充數的廣告和競價排名結果。
  4. 將「把百度設為主頁」換為其他搜索引擎鏈接。

如何使用安裝用戶腳本UserScript):

Firefox用戶請安裝Greasemonkey擴展:
https://addons.mozilla.org/zh-CN/firefox/addon/748

啟用了Greasemonkey擴展的Firefox瀏覽器,點擊下方的下載按鈕即自動安裝《幫助百度讀中文》腳本。

其他瀏覽器用戶請看這裡:
https://www.emulefans.com/userscript-on-various-browsers/

《幫助百度讀中文》UserScript v0.7下載
via

意見和建議請在本文評論中提出。
by tomchen1989 2009-7-8 v0.7

本腳本效果圖:

讀中文效果:
讀中文效果
去廣告和加其他搜索引擎效果:
去廣告和加其他搜索引擎效果

Note:

  1. 本用戶腳本無法給鏈接中的中文關鍵詞的頁面加權重,改變搜索結果次序;
  2. 可以完全隱藏ADBlock Plus的幾個常用list沒有處理到的廣告信息;
  3. 可與BaiduMonkey腳本一同使用,本腳本能完全處理BaiduMonkey沒有處理到的一些廣告信息(可能是沒來及更新的緣故);
  4. 可與baidu++腳本一同使用;
  5. 可與baidu_adbaidu_ad_killer等腳本一同使用,不過本腳本已經包含去廣告功能所以無需使用那些腳本;
  6. 本腳本可運行於IE678、Firefox、Opera、Google Chrome、Safari等瀏覽器,但是可能需要安裝某些瀏覽器的擴展。
  7. 搜索引擎現有12個,默認狀態是「Google英文」。本腳本為輕型腳本,不打算使用GM setValue或cookies,如想修改默認/增/刪/搜索引擎的話,請用記事本打開腳本,手動修改設置。

更新:

ver 0.1 @ 2009-6-26
初始版本。

ver 0.2 @ 2009-6-27
縮減代碼,修正一些錯誤,兼容BaiduMonkey腳本,兼容其他瀏覽器。

ver 0.3 @ 2009-6-29
兼容baidu++、baidu_ad等腳本,恢復無須隱藏的一些文字信息。

ver 0.4 @ 2009-6-30
亂碼變中文和隱藏廣告兩功能分離,修正進行某些搜索時誤隱藏搜索框或鏈接decode錯誤的bug。

ver 0.5 @ 2009-7-2
修正與BaiduMonkey、baidu++三者同時使用的bug,修正GBK等編碼的URL誤decode的bug,新增其他搜索引擎鏈接功能。

ver 0.6.1 @ 2009-7-3
修正搜狗搜索中文字詞的bug,搜索引擎增至14個。

ver 0.7 @ 2009-7-8
無關鍵詞時鏈接變普通文字,兼容新版baidu++1.0.0。

附1:百度中文識別的其他問題

比如搜索「SEO」,目前百度的結果第一頁居然有4個結果是日文網頁,而且幾個日文網頁的標題也識別為亂碼,4個日文網頁中有一個聲明了使用的是日文編碼shift_jis,百度依然無視;

Google搜索「SEO」則無誤,能夠正常識別哪些是中文網頁。

同時,國內無疑有很多SEOer在對關鍵詞「SEO」拚命做SEO,然而,中文搜索引擎百度的「SEO」關鍵詞第一頁結果卻擠進了4個日文網頁,這無疑也是一大諷刺。

另外現在Google已經支持中文分詞搜索了,百度能識別中文分詞的優勢已經不再存在。

ps. wikipedia上的「SEO」解釋

附2:愚昧的《百度更懂中文》視頻廣告

筆者不能想像一個把簡單的中文鏈接讀成亂碼、無法分辨中日文網頁的搜索引擎會做這種廣告:

16條評論隱藏

  1. 2009年6月27日 周六 09:33 | 回復

    關於那個廣告。。。我回憶起一段噴飯的往事來 👿

  2. 2009年6月27日 周六 21:23 | 回復

    噴飯的往事?啥?
    ps. 更新v0.2

    pss. 又發現一款常用的Greasemonkey腳本——baidu++,本腳本暫時無法和baidu++一同使用,正在兼容ing,殘念= =|

    psss. 添加附2

  3. #3 XunXun
    2009年6月29日 周一 15:29 | 回復

    一般用Google搜索中文了 百度很多信息都搜不到 要不就是排到很後面找不到

  4. #4 XunXun
    2009年6月29日 周一 15:31 | 回復

    如果Greasemonkey腳本能像Stylish腳本一樣能檢查更新就好了

  5. #5 XunXun
    2009年6月29日 周一 15:34 | 回復

    這個腳本能把最上面的搜索框也去除 不符合我的使用習慣
    還是單用BaiduMonkey吧

  6. 2009年6月29日 周一 19:26 | 回復

    @XunXun 把最上面的搜索框也去除?應該是bug = =|現在應該沒有了
    現在這個v0.3的情況是:
    和BaiduMonkey一起用的話,BaiduMonkey沒有完全消除廣告,這個腳本能夠徹底消除廣告,還能亂碼變中文;
    和baidu++一起用的話,baidu++已經很好地消除了所有廣告,所以這個腳本做的僅僅是亂碼變中文;

    ==========

    GM腳本自動更新可以使用這個,不過現在這個腳本可能失效了= =|:
    http://userscripts.org/scripts/show/26062
    還有這個Greasefire擴展,這個非常不錯:
    https://addons.mozilla.org/en-US/firefox/addon/8352

  7. 2009年6月29日 周一 19:42 | 回復

    @XunXun
    哦,可能搜索某些關鍵詞還有bug。。我再看看。。。
    ok,現在好了沒?XunXun試試?

    ====

    更新v0.4

  8. #8 XunXun
    2009年6月30日 周二 08:34 | 回復

    @tomchen1989
    現在最上面的搜索框有了
    去廣告也比較理想
    不過我用Baidumonkey的目的是使得搜索結果能分欄顯示和加入用google搜索該關鍵詞的鏈接
    建議這個腳本加入 這樣我才能摒棄BaiduMonkey

    PS:Baidu++也很好,但是不知道啥原因我裝不上,經我的試驗,我的greasemonkey不能安裝名稱帶有”+”字樣的腳本,遇到這個問題,我都得先把腳本下載下來,然後把內外文件名都改成別的字樣才能裝上。

  9. 2009年6月30日 周二 19:23 | 回復

    @XunXun 用不著摒棄BaiduMonkey。我這個只是個小腳本,隨便寫著玩兒的,代碼部分只有3K,baidumonkey代碼77K,baidu++有50K。而且這個小腳本主要還是為了「幫百度讀中文」,去廣告是附帶加了的功能。所以和baidumonkey或者baidu++一起用是絕對沒問題的,也占不了多少空間內存。

    當然加入用google和其他引擎搜索該關鍵詞鏈接的功能也不麻煩,以後考慮 😉

  10. #10 XunXun
    2009年7月1日 周三 12:53 | 回復

    @tomchen1989
    可不可以把這個Greamonkey腳本寫成stylish腳本
    Greasemonkey腳本有滯後性(網頁載入之後處理)
    stylish在網頁載入之前就處理了

  11. 2009年7月2日 周四 05:32 | 回復

    更新0.5,新增其他搜索引擎鏈接功能,見第2張效果圖。
    @XunXun 不加腳本的話,Google的搜索頁用stylish排版、隱藏元素還有可能,百度基本上很難。但是可以做點簡單的,比如我剛剛寫了個這個,和baidumonkey一樣,搜索結果淡藍底色並圓角:
    http://userstyles.org/styles/19150

  12. #12 XunXun
    2009年7月2日 周四 12:56 | 回復

    @tomchen1989
    有沒有什麼比較好的關於Greasemonkey和stylish腳本或者userchrome.js腳本的學習資料么?
    我現在只會修改別人寫的腳本,自己寫不知道有關規則,查到的網上資料說的也不是很詳細

  13. 2009年7月3日 周五 03:50 | 回復

    stylish腳本就是寫css,學寫stylish基本就等於學習css
    Greasemonkey和userchrome.js腳本就是寫Javascript,學寫GM和UC基本就等於學習Javascript

  14. #14 cser
    2009年9月23日 周三 22:35 | 回復

    不知道為什麼,這個js加了之後,可以屏蔽廣告,可是沒有那個 “使用其他搜索引擎搜索” 的效果.和圖上的不太一樣. 😕

  15. 2009年9月24日 周四 23:24 | 回復

    @cser 在哪些搜索頁上不能使用?另外你還使用了那些和baidu搜索有關的擴展或腳本?

  16. #16 philade
    2009年11月28日 周六 21:25 | 回復

    1.希望能在mp3.baidu.com上,也能使用類似的功能,方便的用其他音樂搜索引擎搜索音樂~~

    2.添加的搜索引擎最好改成按鈕式,現在的下拉菜單選擇一個搜索引擎,再點擊搜索的方式感覺不太方便,能類似Google Fx那樣在搜索框下添加一排搜索引擎按鈕就好了·

發表評論

您的Email將不會顯示出來。頭像請至Gravatar.com註冊上傳。*號標註項為必填。

*
*
*
標籤用法
字數:0