Giter Club home page Giter Club logo

awesome-nlp-chinese-corpus's Introduction

awesome-nlp-chinese-corpus

A curated list of resources of chinese corpora for NLP(Natural Language Processing)

中文自然语言处理语料 收集列表

Contents 列表

综合内容

出处 语料大小 年代
upenn.edu 各种 各种
出处 语料大小 年代
conll.org 各种 各种
出处 语料大小 年代
ics.uci.edu 221k 2015
出处 语料大小 年代
www.opensubtitles.org 各种 各种
出处 语料大小 年代
opendata.pku.edu.cn 各种 各种
出处 语料大小 年代
清华大学自然语言处理实验室 740k 2005-2011
出处 语料大小 年代
NLPCC 2017 200k 2017
出处 语料大小 年代
SMP2017ECDT 极少 2017
出处 语料大小 年代
sogou.com 免费小样本 2012
出处 语料大小 年代
bosonnlp.com 中小 2014-2015
出处 语料大小 年代
openkg.cn 各种 各种
出处 语料大小 年代
biendata.com 各种 各种
出处 语料大小 年代
nlpir.org ~2万 2011
出处 语料大小 年代
baidu 950k 2017
出处 语料大小 年代
jhu.edu 19k 2015
出处 语料大小 年代
52nlp.cn 39k 2010
出处 语料大小 年代
github.com/crownpku 各种 各种
出处 语料大小 年代
github.com/crownpku 各种
出处 语料大小 年代
github.com/nonamestreet 3G 未知
出处 语料大小 年代
blog.just4fun.site 各种 各种
出处 语料大小 年代
github.com/Samurais 2016
出处 语料大小 年代
github.com/Samurais 未知
出处 语料大小 年代
erhengzhong 未知 2010-2012

Embedding 词嵌入

模型 语料大小 嵌入大小
word2vec 50101 300
语料大小 嵌入大小
简中332647 300
op 语料大小 嵌入大小
各种 各种 各种
10000 9630 300
200000 146365 300

awesome-nlp-chinese-corpus's People

Contributors

wangmuy avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.