Giter Club home page Giter Club logo

google-chinese-results-blocklist's Introduction

中文搜索结果黑名单

垃圾站点出现在 Google、百度的中文搜索结果中,实在是恶心——于是这个黑名单就这么出来了。

黑名单主要由我自己使用 Google 搜索时收集 (当然,也离不开来自网友的热心分享、提交),所以更新频率无法保证。然而已经断断续续更新了 4 年,就职的公司都被收购了,部门也换了 4 次。

如何使用

安装以下插件导入黑名单,插件选其中之一即可。

强烈建议使用 uBlacklist,因为该插件可以对搜索结果标题进行匹配 (即下方提到的“模糊匹配”)。例如,Google 搜索结果中可能有成百上千的“小 X 百科网”、“小 X 知识网”,以域名匹配的方式几乎是不可能的 (即下方提到的“精确匹配”)。这时用正则模糊匹配结果标题,将会非常简单。

同理,由于 Google Hit Hider by DomainAC-baidu 没有匹配标题的功能,屏蔽效果会比 uBlacklist 差。

屏蔽 Google 中文搜索结果

1. uBlacklist (下载地址:Chrome Web StoreFirefox Add-onsMac App Store)

  • 将以下 2 个链接,通过点击 Add a subscription 添加到 Subscription 分类下。

    • 精确匹配:该匹配方式主要是通过 *://*.xxxx.com/* 的方式来匹配搜索结果,进行过滤。基本不会有误杀。

    • 模糊匹配:该匹配方式主要是通过如 *://*/list.php?s=*title/小.(百科|知识)网/ 的方式来匹配搜索结果,进行过滤。存在小范围的误杀。

      • 请仔细查看当前模糊匹配列表 (下方列表为最新规则),若会击中自己经常使用的网站,请自行修改规则配置到插件中,防止被误杀。
        *://*/so.php
        *://*/so.php?s=*
        *://*/cha.php?s=*
        *://*/list.php?s=*
        *://*/?s=*
        *://*/so/*
        title/^小.(百科|知识)网$/
        title/^.*[ ]-[ ]小.(百科|知识)网$/
        title/.*点击一次就可以出国/
        title/.*一键访问国外网站/

2. Google Hit Hider by Domain (下载地址:GreasyFork)

  • 该列表中的网址,通过 List Until -> Import 进行导入。

屏蔽百度中文搜索结果

1. Google Hit Hider by Domain (下载地址:GreasyFork)

  • 同 Google 方案操作。

2. AC-baidu (下载地址:GreasyFork)

  • 开启“附加2-自主拦截域名”,点击 DIY,将该列表中的网址导入。

注:这个脚本似乎也会同时对搜狗、谷歌、必应搜索结果同时产生影响。

反馈

加入反馈群 (Telegram) 来更快的分享规则、提出建议。

google-chinese-results-blocklist's People

Contributors

chencangx avatar cnvaan avatar cobaltdisco avatar electronicelephant avatar firokotaku avatar fishorbear avatar lvii avatar qwq233 avatar rhjdvsgsgks avatar teaim avatar tjsky avatar wanghao229 avatar whentojump avatar wydy avatar ymyguang avatar ysy950803 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

google-chinese-results-blocklist's Issues

建议增加对 .buzz 的拦截

对应的正则格式是:
/\S+\.(it|pl|site|de|be|club|vn|mx|fr|buzz)/
拦截以 it, pl, site, de, be, club, 。。。结尾的域名

在google上搜索 "知识网 site:.buzz" 可以找到数十个以 .buzz 结尾的域名,点开后全都跳转到同一个,小塔百科网,或 xx百科网

add sites

*://118.193.38.103/*
*://www.uwin100.com/*
*://wap.qhddns.com/*
*://www.hsksuo.com/*
*://in.gsyyq.com/*
*://www.ljyhky.com/*
*://www.czag88.com/*
*://weiyuncity.com/*
*://yiemu.com/*
*://52876780.zisenvren.com/*
*://m.xiaocai88.com/*
*://www.yanirsan.buzz/*
*://www.byswq.com/*
*://23086096.carucc.com/*
*://www.utppzuj.buzz/*
*://www.gatos.buzz/*
*://www.novbox.buzz/*
*://www.viddie.buzz/*
*://www.kadiankm.com/*
*://www.myorlandoac.buzz/*
*://ni.cafegatto.com/*
*://hnvtedty.ptsyyy.com/*
*://www.visbar.buzz/*
*://www.hrs24.buzz/*
*://vgchg.waynepmj.com/*
*://www.lifely.buzz/*
*://www.uajctja.buzz/*
*://www.q8ab.com/*
*://www.shouchaobaotupianku.com/*
*://owyje.0818hj.com/*
*://www.qiyanhui.com/*
*://bxyowct.o2top.com/*
*://zzyyo.com/*
*://www.topp57.com/*
*://60429248.fusen0.com/*
*://yb.wzylzb.com/*
*://www.kybellebourbon.buzz/*
*://www.funtomo.com/*
*://m.gansuxiaochi.com/*
*://qzczd.com/*

如何屏蔽“小搭百科网”?

小搭百科网的真实地址是 https://g.penzai.com/

但是其有数十个,.com, .buzz 域名,全部重定向到 https://g.penzai.com/

目前发现的域名有:

一个个的手动添加太烦索,且说不定他注册的域名不久后就被“正常的”所用了,还造成了误屏蔽。

求支招。

规则添加

  1. 通配符规则
*://*.jd.com/*/Search?keyword=*
*://*/searchArticle?qc=*
*://*/search?keyword=*
*://www.baidu.com/sf/vsearch?pd=*
*://www.baidu.com/from=*/ssid=*/s?word=*
  1. 域名
*://www.h2bev.buzz/*
*://iv09.com/*
*://www.18-21nakedgirls.com/*
*://www.javashuo.com/*
*://so.ixigua.com/*
*://search.suning.com/*

add sites

www.huaweicloud.com/articles/*
华为云,界面乱,全都是转载, 类似的还有阿里云

pai-hang-bang.com/*
网络排行榜,文章全是转载,而且其内容现在全都打不开

有无使用hosts文件屏蔽方法

电脑上是舒服了,发现手机上体验依旧很差,然而手机上chrome又不能装插件。
所以问问能不能转成hosts文件方式屏蔽

防不胜防

*://www.naotan020.com/*
*://www.zcblsw.com/*
*://www.ctcea.org/*
*://www.vk-c.net/*
*://www.jun365.net/*
*://www.zbqy.net/*
*://www.lawpingsew.com/*
*://www.xianjinghn.com/*
*://www.sonanone.com/*
*://www.zhangjingchu.org/*
*://www.wispypages.com/*
*://www.sdfymy777.com/*
*://www.lwesedu.com/*
*://www.immo-logis.net/*
*://www.weiboroom.com/*
*://www.gzgxzsj.com/*
*://www.thelittlestrawberryfarm.com/*
*://www.huangjinqihuo.com/*
*://www.odf-ts.com/directory/*
*://www.suxa.org/*
*://www.shouji211.com/*
*://www.homewanchai.com/*
*://www.bypidenver.com/*

关于正则表达式中的尖号和美元符

经测试,在正则表达式中 ^ 符可有可无,$ 符不能用
如,我要屏蔽纯数字网站,结尾是 cn, com

/^https?:\/\/(www\.)?\d+\.(cn|com)//https?:\/\/(www\.)?\d+\.(cn|com)/是可行的。

但是 /^https?:\/\/(www\.)?\d+\.(cn|com)$//https?:\/\/(www\.)?\d+\.(cn|com)$/ 都是不可行的。

add sites

*://bifentuijian.swiftbn.com/*
*://xinfx.cc/*
*://m.18183.com/*
*://m.qishh.com/*
*://m.tabuzhe.com/*
*://xindd.cc/*
*://taofx.cc/*
*://yifx.cc/*
*://www.youchuang365.com/*
*://sunnews.cc/*

其中xin***.cc和***fx.cc疑似为新的中文SEO站群

使用脚本导致ublacklist失效

对于使用了自动翻页脚本的搜索页面,ublacklist无法生效。导致我自动翻页脚本和ublacklist只能挑一个用,有啥解决办法吗?

看你半夜还回复我,就免费提供100个利用我开源代码赚钱的垃圾站

www.17daili.com
www.jinshizheyang.com
www.1990th.com
www.zhihuiye.cn
meihuboyue.com
www.whscl01.com
lamawe.com
www.sunus-china.com
www.0714news.com
www.neiyi35.com
www.wh027seo.com
www.baozhuang5.com
www.jxjahy.com
www.gzcxx.com
www.cngadget.cn
www.uryu-tools.com
www.dongnanshan.com
www.ftsx.net
www.98bst.com
www.zkgcjx.com
www.hbgggs.com
www.sdfkxm.com
www.wzmucrf.com
www.shmao.com
www.35bf.com
www.sybzc.com
www.45r.com
www.yanjingge.com
www.sibime.com
www.shitingzhuanjia.com
www.chinacno.org
www.fzdai.com
www.daoyouz.com
918ch.cn
www.kenong5.com
www.yzjcn.com
www.photoplayhouse.com
www.bjhswx.com
www.shzhuhuang.com
www.qxguodai.cn
www.crscs-global.com
www.hszw.org
www.cwqq.org
www.weixingon.com
www.hmg-china.com
www.qskcfw.com
www.05693.com
www.dir2345.com
www.xmngd.org.cn
www.solvyou.com
www.cbn123.com
www.kqrlj.com
www.book120.com
www.hongyu99.com
www.xcsteel.net
www.czlyhb.com
www.garlic5.com
www.engbus.com
www.whdlzy.com
www.shfktdq-a.com
sggl.org
www.glzxw.com
www.ctt315.com
www.megadyne-belt.com
www.56886.com.cn
www.czldzs.com
www.sqymj.cn
www.lcmdzx.com
www.kmg360.com
www.chinababyangel.com
www.zlsafe.com
www.974m.com
www.gzydcm.com
www.up777.com
www.dmyzw.com
www.xilinglong.net
www.bzsifang.com
www.ciawe.com
www.bunxcdq.com
www.could2.com
www.alxb.info
www.archcn.net
www.kanxingtai.com
www.bailiao.com.cn
www.hiozlab.com
www.zr8c.com
www.lyxfcp.com
www.banner-global.com.cn
hnysxk.com
www.tchhd.com.cn
www.smiseo.com
www.xitong1.com
www.zhujiedz.com
www.zmidea.com
www.qqseller.com
bf.086wl.com
www.meizx.com
www.acdmart.com
www.sssxw.cn
www.fyocqnz.com

add sites

thagoda.com
igotojapan.com
jpgooverseas.com
bannercuts.com
www.womenlawyers.org
immobiliarestella.com
waterscapetexas.com
www.museumsschiff-gera.de
parkinsonscare.org.uk
www.meltzerlippe.com
www.siberkreasi.id
www.kstuca.kharkov.ua
momoitaliankitchen.com
csm-osumi.org
benpacpackaging.com
crighton-theatre.com
www.hjt1.org
rahumae.tln.edu.ee
www.nysmith.com
www.peanutmidwest.com
meegan.oceantradingeurope.es
oks.no
vesr.sk
theophilechurch.com
www.comeseeme.org
www.berbeederby.com
olsson.bonitochalet.es
www.cabanas.gal
nntc.nnov.ru
portney.htmlstrict.de
www.barbers-auctions.co.uk
bvalve.es
www.eurasianbrands.com
www.inovadiagnostico.com.ar
www.koehlbrandbrueckenlauf.de
cleanessays.com
ashcroft.com.br
www.pizzasprint.com
www.liveinlimbo.com
noa.it
www.transcend.co.za
wcmcc.org
agmc.hyogo.jp
www.suessstoff-verband.info
stancil.dianaypablo.es
nextpublic.de
www.legislation.tn
patobriens.com
kandicekeith.ca
starporttech.com
medicallhome.mx
napolicalcio24.com
rahumae.tln.edu.ee
www.yukoninfo.com
ashcroft.com.br
kstuca.kharkov.ua
www.comeseeme.org
www.dopovidi-nanu.org.ua
www.koehlbrandbrueckenlauf.de
www.barbers-auctions.co.uk
somersetlending.com
monika-martin.at
waterscapetexas.com
csm-osumi.org
www.besteciler.com
golfisabella.fr
www.energia.imdea.org
headwayadp.org.au
www.pizzasprint.com
bvalve.es
anippac.org.mx
www.peanutmidwest.com
www.eurasianbrands.com
hd.stheadline.com
www.omniaviation.com
www.rochesterevents.com
adeq.or.th
rcmdc.com.ua
www.hjt1.org
fordhamnrc.com
jclinicth.com
gkka.hr
sportsecyclopedia.com
www.nsw.scouts.com.au
www.insronda.cat
www.patobriens.com
mirrormirror.uk.com
jurisprudentes.es
web.cnzf.gob.ni
utc.org
benpacpackaging.com
greatlakeso.com
vpet-congress.ch
www.thaipublica.org
www.suzuyo.co.th
dacha-eco.kh.ua
wallacevilleestate.co.nz
mirimichigreen.com

Chrome快捷键的修改方法已经失效(ResHacker)

大佬你好,有点冒昧提起这个无关话题,因为实在没有别的渠道能联系到你。

大概在n年前,你曾经写了一篇关于《使用ResHacker自定义Chrome快捷键》。这个方法我最近试了几次已经失效了。大约是不太喜欢chrome越来越霸道的限制风格,让我走上了修改原生快捷键这条不归路(通过扩展比较无力)。

所以现在是否有其他方法来自定义chrome的原生快捷键?

add site

javaroad.cn
机器翻译stackoverflow内容农场

不再屏蔽kafan?

我猜是因为“卡饭教程”。现在kafan.cn/topic已经404了,它们应该移除掉这个功能了。
当然,本列表是阁下维护的,feel free to won't fix.

"XX搜" 之类的垃圾站

检索词: 天斧100zx
网站举例:

*://jssou.cc/*
*://ysou.cc/*
*://chaosou.cc/*
*://sounote.cc/*
*://ksou.cc/*

屏蔽规则: title/^.*[ ]-[ ].{1,2}搜$/

image

添加两条规则

华为云的导流站

*://support.huaweicloud.com/topic/*
*://www.huaweicloud.com/theme/*

补充一些规则

*://www.hotbak.net/*
*://www.9999ktv.com/*
*://gnews.org/*
*://m.dingjisc.com/*
*://www.bolingtuan.com/*
*://shufadashi.com/*
*://www.dannypets.com/*
*://www.guzhifa.com/*
*://tiku.link/*
*://app.51xuexiaoyi.com/*
*://www.wenjingwudao.com/*
*://blog.haishengship.com/*
*://www.xinnet.com/*
*://nethelpdesk.cn/*
*://www.webplus.org.cn/*
*://scikitlearn.com.cn/*
*://sklearn.apachecn.org/*
*://*.bendibao.com/*
*://www.fashion-high.net/*
*://www.xiezuola.com/*
*://www.yxjdcc.com/*
*://www.53kr.com/*
*://www.xsj2188.com/*

正则匹配,规则分组及其他

推荐正则采用 ^...$ 的方式。

title/^.*-\s*..(|)\s*$/
title/^.(|)$/
title/^.(|)$/

Examples:

// 针对 `balabala - xx知识网` 这种格式
title/^.*-\s*..(百科|知识)\s*网$/    

// 针对直接就是 `小x知识网` 这种形式
title/^小.(百科|知识)网$/          
title/^.小(百科|知识)网$/

另外希望能把正则匹配规则,url 匹配规则等单列出来。

最后附上咱自己积累的一个规则列表,全是自己用 Google 的时候手动添加的:

https://raw.githubusercontent.com/kurikomoe/KurikoRulesets/master/ublacklist.txt

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.