有人說百度(baidu)讀中文的能力強於Google(谷歌)等其他搜索引擎,筆者深不以為然。截止北京時間2009年6月27日,百度依然無法閱讀頁面鏈接中出現的中文,搜索到的頁面鏈接有中文的話,搜索結果下方的鏈接中顯示為亂碼。而Google等一些搜索引擎不但顯示正確,而且還能給鏈接中帶有中文關鍵詞的頁面加權重。為了讓百度會讀中文,這裡筆者寫了一個《幫助百度讀中文》用戶腳本。
《幫助百度讀中文》用戶腳本的功能有:
- 能夠更好地幫助百度閱讀鏈接中出現的中文(不限於中文字,理論上是所有CJK漢字,乃至於所有文字),消滅亂碼,讓它顯示正確;
- 消滅百度右欄的諸多廣告,右欄僅保留關鍵詞的貼吧鏈接提示;
- 消滅百度搜索結果中濫竽充數的廣告和競價排名結果。
- 將「把百度設為主頁」換為其他搜索引擎鏈接。
如何使用安裝用戶腳本(UserScript):
Firefox用戶請安裝Greasemonkey擴展:
https://addons.mozilla.org/zh-CN/firefox/addon/748
啟用了Greasemonkey擴展的Firefox瀏覽器,點擊下方的下載按鈕即自動安裝《幫助百度讀中文》腳本。
其他瀏覽器用戶請看這裡:
https://www.emulefans.com/userscript-on-various-browsers/
《幫助百度讀中文》UserScript v0.7下載
via
意見和建議請在本文評論中提出。
by tomchen1989 2009-7-8 v0.7
本腳本效果圖:
Note:
- 本用戶腳本無法給鏈接中的中文關鍵詞的頁面加權重,改變搜索結果次序;
- 可以完全隱藏ADBlock Plus的幾個常用list沒有處理到的廣告信息;
- 可與BaiduMonkey腳本一同使用,本腳本能完全處理BaiduMonkey沒有處理到的一些廣告信息(可能是沒來及更新的緣故);
- 可與baidu++腳本一同使用;
- 可與baidu_ad、baidu_ad_killer等腳本一同使用,不過本腳本已經包含去廣告功能所以無需使用那些腳本;
- 本腳本可運行於IE678、Firefox、Opera、Google Chrome、Safari等瀏覽器,但是可能需要安裝某些瀏覽器的擴展。
- 搜索引擎現有12個,默認狀態是「Google英文」。本腳本為輕型腳本,不打算使用GM setValue或cookies,如想修改默認/增/刪/搜索引擎的話,請用記事本打開腳本,手動修改設置。
更新:
ver 0.1 @ 2009-6-26
初始版本。
ver 0.2 @ 2009-6-27
縮減代碼,修正一些錯誤,兼容BaiduMonkey腳本,兼容其他瀏覽器。
ver 0.3 @ 2009-6-29
兼容baidu++、baidu_ad等腳本,恢復無須隱藏的一些文字信息。
ver 0.4 @ 2009-6-30
亂碼變中文和隱藏廣告兩功能分離,修正進行某些搜索時誤隱藏搜索框或鏈接decode錯誤的bug。
ver 0.5 @ 2009-7-2
修正與BaiduMonkey、baidu++三者同時使用的bug,修正GBK等編碼的URL誤decode的bug,新增其他搜索引擎鏈接功能。
ver 0.6.1 @ 2009-7-3
修正搜狗搜索中文字詞的bug,搜索引擎增至14個。
ver 0.7 @ 2009-7-8
無關鍵詞時鏈接變普通文字,兼容新版baidu++1.0.0。
附1:百度中文識別的其他問題
比如搜索「SEO」,目前百度的結果第一頁居然有4個結果是日文網頁,而且幾個日文網頁的標題也識別為亂碼,4個日文網頁中有一個聲明了使用的是日文編碼shift_jis,百度依然無視;
而Google搜索「SEO」則無誤,能夠正常識別哪些是中文網頁。
同時,國內無疑有很多SEOer在對關鍵詞「SEO」拚命做SEO,然而,中文搜索引擎百度的「SEO」關鍵詞第一頁結果卻擠進了4個日文網頁,這無疑也是一大諷刺。
另外現在Google已經支持中文分詞搜索了,百度能識別中文分詞的優勢已經不再存在。
附2:愚昧的《百度更懂中文》視頻廣告
筆者不能想像一個把簡單的中文鏈接讀成亂碼、無法分辨中日文網頁的搜索引擎會做這種廣告:
16條評論隱藏
關於那個廣告。。。我回憶起一段噴飯的往事來 👿
噴飯的往事?啥?
ps. 更新v0.2
pss. 又發現一款常用的Greasemonkey腳本——baidu++,本腳本暫時無法和baidu++一同使用,正在兼容ing,殘念= =|
psss. 添加附2
一般用Google搜索中文了 百度很多信息都搜不到 要不就是排到很後面找不到
如果Greasemonkey腳本能像Stylish腳本一樣能檢查更新就好了
這個腳本能把最上面的搜索框也去除 不符合我的使用習慣
還是單用BaiduMonkey吧
@XunXun 把最上面的搜索框也去除?應該是bug = =|現在應該沒有了
現在這個v0.3的情況是:
和BaiduMonkey一起用的話,BaiduMonkey沒有完全消除廣告,這個腳本能夠徹底消除廣告,還能亂碼變中文;
和baidu++一起用的話,baidu++已經很好地消除了所有廣告,所以這個腳本做的僅僅是亂碼變中文;
==========
GM腳本自動更新可以使用這個,不過現在這個腳本可能失效了= =|:
http://userscripts.org/scripts/show/26062
還有這個Greasefire擴展,這個非常不錯:
https://addons.mozilla.org/en-US/firefox/addon/8352
@XunXun
哦,可能搜索某些關鍵詞還有bug。。我再看看。。。
ok,現在好了沒?XunXun試試?
====
更新v0.4
@tomchen1989
現在最上面的搜索框有了
去廣告也比較理想
不過我用Baidumonkey的目的是使得搜索結果能分欄顯示和加入用google搜索該關鍵詞的鏈接
建議這個腳本加入 這樣我才能摒棄BaiduMonkey
PS:Baidu++也很好,但是不知道啥原因我裝不上,經我的試驗,我的greasemonkey不能安裝名稱帶有”+”字樣的腳本,遇到這個問題,我都得先把腳本下載下來,然後把內外文件名都改成別的字樣才能裝上。
@XunXun 用不著摒棄BaiduMonkey。我這個只是個小腳本,隨便寫著玩兒的,代碼部分只有3K,baidumonkey代碼77K,baidu++有50K。而且這個小腳本主要還是為了「幫百度讀中文」,去廣告是附帶加了的功能。所以和baidumonkey或者baidu++一起用是絕對沒問題的,也占不了多少空間內存。
當然加入用google和其他引擎搜索該關鍵詞鏈接的功能也不麻煩,以後考慮 😉
@tomchen1989
可不可以把這個Greamonkey腳本寫成stylish腳本
Greasemonkey腳本有滯後性(網頁載入之後處理)
stylish在網頁載入之前就處理了
更新0.5,新增其他搜索引擎鏈接功能,見第2張效果圖。
@XunXun 不加腳本的話,Google的搜索頁用stylish排版、隱藏元素還有可能,百度基本上很難。但是可以做點簡單的,比如我剛剛寫了個這個,和baidumonkey一樣,搜索結果淡藍底色並圓角:
http://userstyles.org/styles/19150
@tomchen1989
有沒有什麼比較好的關於Greasemonkey和stylish腳本或者userchrome.js腳本的學習資料么?
我現在只會修改別人寫的腳本,自己寫不知道有關規則,查到的網上資料說的也不是很詳細
stylish腳本就是寫css,學寫stylish基本就等於學習css
Greasemonkey和userchrome.js腳本就是寫Javascript,學寫GM和UC基本就等於學習Javascript
不知道為什麼,這個js加了之後,可以屏蔽廣告,可是沒有那個 “使用其他搜索引擎搜索” 的效果.和圖上的不太一樣. 😕
@cser 在哪些搜索頁上不能使用?另外你還使用了那些和baidu搜索有關的擴展或腳本?
1.希望能在mp3.baidu.com上,也能使用類似的功能,方便的用其他音樂搜索引擎搜索音樂~~
2.添加的搜索引擎最好改成按鈕式,現在的下拉菜單選擇一個搜索引擎,再點擊搜索的方式感覺不太方便,能類似Google Fx那樣在搜索框下添加一排搜索引擎按鈕就好了·