有人说百度(baidu)读中文的能力强于Google(谷歌)等其他搜索引擎,笔者深不以为然。截止北京时间2009年6月27日,百度依然无法阅读页面链接中出现的中文,搜索到的页面链接有中文的话,搜索结果下方的链接中显示为乱码。而Google等一些搜索引擎不但显示正确,而且还能给链接中带有中文关键词的页面加权重。为了让百度会读中文,这里笔者写了一个《帮助百度读中文》用户脚本。
《帮助百度读中文》用户脚本的功能有:
- 能够更好地帮助百度阅读链接中出现的中文(不限于中文字,理论上是所有CJK汉字,乃至于所有文字),消灭乱码,让它显示正确;
- 消灭百度右栏的诸多广告,右栏仅保留关键词的贴吧链接提示;
- 消灭百度搜索结果中滥竽充数的广告和竞价排名结果。
- 将“把百度设为主页”换为其他搜索引擎链接。
如何使用安装用户脚本(UserScript):
Firefox用户请安装Greasemonkey扩展:
https://addons.mozilla.org/zh-CN/firefox/addon/748
启用了Greasemonkey扩展的Firefox浏览器,点击下方的下载按钮即自动安装《帮助百度读中文》脚本。
其他浏览器用户请看这里:
https://www.emulefans.com/userscript-on-various-browsers/
《帮助百度读中文》UserScript v0.7下载
via
意见和建议请在本文评论中提出。
by tomchen1989 2009-7-8 v0.7
本脚本效果图:
Note:
- 本用户脚本无法给链接中的中文关键词的页面加权重,改变搜索结果次序;
- 可以完全隐藏ADBlock Plus的几个常用list没有处理到的广告信息;
- 可与BaiduMonkey脚本一同使用,本脚本能完全处理BaiduMonkey没有处理到的一些广告信息(可能是没来及更新的缘故);
- 可与baidu++脚本一同使用;
- 可与baidu_ad、baidu_ad_killer等脚本一同使用,不过本脚本已经包含去广告功能所以无需使用那些脚本;
- 本脚本可运行于IE678、Firefox、Opera、Google Chrome、Safari等浏览器,但是可能需要安装某些浏览器的扩展。
- 搜索引擎现有12个,默认状态是“Google英文”。本脚本为轻型脚本,不打算使用GM setValue或cookies,如想修改默认/增/删/搜索引擎的话,请用记事本打开脚本,手动修改设置。
更新:
ver 0.1 @ 2009-6-26
初始版本。
ver 0.2 @ 2009-6-27
缩减代码,修正一些错误,兼容BaiduMonkey脚本,兼容其他浏览器。
ver 0.3 @ 2009-6-29
兼容baidu++、baidu_ad等脚本,恢复无须隐藏的一些文字信息。
ver 0.4 @ 2009-6-30
乱码变中文和隐藏广告两功能分离,修正进行某些搜索时误隐藏搜索框或链接decode错误的bug。
ver 0.5 @ 2009-7-2
修正与BaiduMonkey、baidu++三者同时使用的bug,修正GBK等编码的URL误decode的bug,新增其他搜索引擎链接功能。
ver 0.6.1 @ 2009-7-3
修正搜狗搜索中文字词的bug,搜索引擎增至14个。
ver 0.7 @ 2009-7-8
无关键词时链接变普通文字,兼容新版baidu++1.0.0。
附1:百度中文识别的其他问题
比如搜索“SEO”,目前百度的结果第一页居然有4个结果是日文网页,而且几个日文网页的标题也识别为乱码,4个日文网页中有一个声明了使用的是日文编码shift_jis,百度依然无视;
而Google搜索“SEO”则无误,能够正常识别哪些是中文网页。
同时,国内无疑有很多SEOer在对关键词“SEO”拼命做SEO,然而,中文搜索引擎百度的“SEO”关键词第一页结果却挤进了4个日文网页,这无疑也是一大讽刺。
另外现在Google已经支持中文分词搜索了,百度能识别中文分词的优势已经不再存在。
附2:愚昧的《百度更懂中文》视频广告
笔者不能想象一个把简单的中文链接读成乱码、无法分辨中日文网页的搜索引擎会做这种广告:
16条评论隐藏
关于那个广告。。。我回忆起一段喷饭的往事来 👿
喷饭的往事?啥?
ps. 更新v0.2
pss. 又发现一款常用的Greasemonkey脚本——baidu++,本脚本暂时无法和baidu++一同使用,正在兼容ing,残念= =|
psss. 添加附2
一般用Google搜索中文了 百度很多信息都搜不到 要不就是排到很后面找不到
如果Greasemonkey脚本能像Stylish脚本一样能检查更新就好了
这个脚本能把最上面的搜索框也去除 不符合我的使用习惯
还是单用BaiduMonkey吧
@XunXun 把最上面的搜索框也去除?应该是bug = =|现在应该没有了
现在这个v0.3的情况是:
和BaiduMonkey一起用的话,BaiduMonkey没有完全消除广告,这个脚本能够彻底消除广告,还能乱码变中文;
和baidu++一起用的话,baidu++已经很好地消除了所有广告,所以这个脚本做的仅仅是乱码变中文;
==========
GM脚本自动更新可以使用这个,不过现在这个脚本可能失效了= =|:
http://userscripts.org/scripts/show/26062
还有这个Greasefire扩展,这个非常不错:
https://addons.mozilla.org/en-US/firefox/addon/8352
@XunXun
哦,可能搜索某些关键词还有bug。。我再看看。。。
ok,现在好了没?XunXun试试?
====
更新v0.4
@tomchen1989
现在最上面的搜索框有了
去广告也比较理想
不过我用Baidumonkey的目的是使得搜索结果能分栏显示和加入用google搜索该关键词的链接
建议这个脚本加入 这样我才能摒弃BaiduMonkey
PS:Baidu++也很好,但是不知道啥原因我装不上,经我的试验,我的greasemonkey不能安装名称带有”+”字样的脚本,遇到这个问题,我都得先把脚本下载下来,然后把内外文件名都改成别的字样才能装上。
@XunXun 用不着摒弃BaiduMonkey。我这个只是个小脚本,随便写着玩儿的,代码部分只有3K,baidumonkey代码77K,baidu++有50K。而且这个小脚本主要还是为了“帮百度读中文”,去广告是附带加了的功能。所以和baidumonkey或者baidu++一起用是绝对没问题的,也占不了多少空间内存。
当然加入用google和其他引擎搜索该关键词链接的功能也不麻烦,以后考虑 😉
@tomchen1989
可不可以把这个Greamonkey脚本写成stylish脚本
Greasemonkey脚本有滞后性(网页加载之后处理)
stylish在网页加载之前就处理了
更新0.5,新增其他搜索引擎链接功能,见第2张效果图。
@XunXun 不加脚本的话,Google的搜索页用stylish排版、隐藏元素还有可能,百度基本上很难。但是可以做点简单的,比如我刚刚写了个这个,和baidumonkey一样,搜索结果淡蓝底色并圆角:
http://userstyles.org/styles/19150
@tomchen1989
有没有什么比较好的关于Greasemonkey和stylish脚本或者userchrome.js脚本的学习资料么?
我现在只会修改别人写的脚本,自己写不知道有关规则,查到的网上资料说的也不是很详细
stylish脚本就是写css,学写stylish基本就等于学习css
Greasemonkey和userchrome.js脚本就是写Javascript,学写GM和UC基本就等于学习Javascript
不知道为什么,这个js加了之后,可以屏蔽广告,可是没有那个 “使用其他搜索引擎搜索” 的效果.和图上的不太一样. 😕
@cser 在哪些搜索页上不能使用?另外你还使用了那些和baidu搜索有关的扩展或脚本?
1.希望能在mp3.baidu.com上,也能使用类似的功能,方便的用其他音乐搜索引擎搜索音乐~~
2.添加的搜索引擎最好改成按钮式,现在的下拉菜单选择一个搜索引擎,再点击搜索的方式感觉不太方便,能类似Google Fx那样在搜索框下添加一排搜索引擎按钮就好了·