Giter Club home page Giter Club logo

content-farm-list's Introduction

内容农场网站清单

Google 中文搜索结果包含了相当一部分的内容农场式条目,比如「小 X 知识网」「小 X 百科网」。此种链接常会 302 重定向其主站,页面内容为自动生成,大量堆叠关键字,揉杂一些爬取到的内容,完全不具可读性和参考价值。

尤为过分的是,该类网站可能有成千上万个分身域名被 Google 收录,严重影响搜索体验。详见 2021 年 10 初的社区反馈:

  1. Github: 如何屏蔽“小搭百科网”?
  2. V2EX: 请问在 google 搜索时,频繁遇到小 X 知识网等内容农场式结果,怎么办?
  3. V2EX: google 搜中文太毒了吧,是不是已经放弃中文搜索了
  4. HOSTLOC: 这采集站群太强了吧
  5. HOSTLOC: 小*知识网站群是哪位大佬的杰作

使用正则匹配标题的方式不能完全屏蔽,所以为方便广大网友过滤搜索结果,特整理此清单。

由于此次事件主角「小搭百科网」在造成影响后主动关站,所以接下来也将关注、收录其他的类似内容农场站。

使用方式

uBlacklist

安装 uBlacklist

Chrome Web Store / Firefox Add-ons / App Store (for macOS and iOS)

后进入 Option 菜单,点击 Add a subscription,输入如下内容:

  • Name: content-farm-list
  • URL: https://raw.githubusercontent.com/wdmpa/content-farm-list/main/uBlacklist.txt

  • Name: content-farm-list
  • URL: https://wdmpa.org/content-farm-list/uBlacklist.txt

单击 'Add' 按钮。

Google Hit Hider

http://www.jeffersonscher.com/gm/google-hit-hider/

Install

Grease Fork / OpenUserJS.org

Manage lists

http://www.jeffersonscher.com/gm/google-hit-hider/manage-lists.php

订阅说明

文件 说明
uBlacklist.txt uBlacklist 规则集合
Surge.txt Surge 规则集合
uBlacklist/spam/g.penzai.com.txt uBlacklist 专用小搭百科网域名集合
Surge/spam/g.penzai.com.txt Surge 专用小搭百科网域名集合
uBlacklist/machine-translated/stackoverflow.txt uBlacklist 专用机翻 StackOverflow 域名集合
Surge/machine-translated/stackoverflow.txt Surge 专用机翻 StackOverflow 域名集合

设置搜索引擎

因与清单中域名匹配的结果会被移除,所以搜索引擎的结果页剩余条目太少,不便浏览,建议登录后设置搜索结果显示为每页面 100 条。

我们能做什么?

一、发 PR 添加域名

  1. 从本地插件 uBlacklist 中导出域名列表
  2. 在搜索引擎中尝试长尾关键词,以发现更多目前权重尚低的农场域名

按结构在 domains 目录中添加新的分类集合文件。参考文件中已有内容的格式,在任意位置添加即可。(Fork 本仓库后编辑再 Push,或在页面中编辑均可。)

文件 说明
domains/spam/g.penzai.com.txt 小搭百科网域名集合
domains/machine-translated/stackoverflow.txt 机翻 StackOverflow 域名集合

提交后,脚本会自动更新订阅文件中的内容。

二、举报

向其使用的云服务提供商举报其滥用行为。

content-farm-list's People

Contributors

akelio-zhang avatar chalkim avatar dallaslu avatar github-actions[bot] avatar justziya avatar neruthes avatar ns-sp4ce avatar quzard avatar scomper avatar wafer-li avatar wegood9 avatar wordlessecho avatar xifangczy avatar yi0322 avatar yygcom avatar zieglar avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.