seekertrue Goto Github PK

followers: 0.0 following: 1.0 repos: 58.0 gists: 0.0

Type: User

seekertrue's Projects

-2020_university_scholar_discovery-system

利用网络爬虫技术，从国内外各大高校公开的网站和资源上，搜寻并下载各个高校专家，教授等学者信息，并为这些学者研究方向建立画像系统。用户可以按学校，专业，学科，论文，研究方向等各个维度去查看和对比各位学者的研究领域信息。基本模块：专家数据爬取模块，论文信息爬取模块，基于专家画像的信息抽取，专家搜索引擎，研究方向提取，专家自我网络中主题圈发现，数据可视化

anti-anti-spider

越来越多的网站具有反爬虫特性，有的用图片隐藏关键数据，有的使用反人类的验证码，建立反反爬虫的代码仓库，通过与不同特性的网站做斗争（无恶意）提高技术。（欢迎提交难以采集的网站）

awesome-free-chatgpt

🆓免费的 ChatGPT 镜像网站列表，持续更新。List of free ChatGPT mirror sites, continuously updated.

chatglm-6b

ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型

chatgpt

🔮 ChatGPT Desktop Application (Mac, Windows and Linux)

chatgpt-on-wechat

基于大模型搭建的微信聊天机器人，同时支持微信、企业微信、公众号、飞书接入，可选择GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/LinkAI，能处理文本、语音和图片，访问操作系统和互联网，支持基于自有知识库进行定制企业智能客服。

chatterbot

ChatterBot is a machine learning, conversational dialog engine for creating chat bots

chinese

Tools and resources for Chinese texts preprocessing. Validated in two papers, one CCF C, EI indexing and one CCF B, SCI indexing.

chinese-rhymer

轻量中文押韵神器，100%绝对可用，傻瓜式命令行操作，秒速实现烈焰单押，闪电双押，龙卷三押以及海啸式四押，目前版本 v0.2.6。Search for rhymes for Chinese words, with 1, 2, 3 and 4 characters, released on PyPI with current version of 0.2.6.

chinesewordsegmentation

Chinese word segmentation algorithm without corpus（无需语料库的中文分词）

文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据**知网URL的规律，爬取70多万条2014年公开的发明专利，然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取，依照词频排序提取前3000个词语形成语义词典，然后根据观察设置停用词。然后再用TF-IDF的方式对每个摘要进行词频选取，通过布尔模型，对比语义词典生成文本向量。然后对标签进行数字化转换。取90%的文本为训练集，10%的文本为测试集。用有监督学习的SVM算法对文本进行分类，（人类生活必需品、作业运输、化学冶金、纺织造纸、固定建筑物、机械工程、物理学、电学）分成8类

cnrhythm

中文押韵工具。

complexeventextraction

A concept and obvious expression pattern collection of Chinese compound event extraction which then be evolved into ComplexEventGraph，本项目提出了中文复合事件的概念与显式模式，包括条件事件、因果事件、顺承事件、反转事件等事件抽取，并形成事理图谱。

cookiespool

CookiesPool Based on Redis

disruptivetechnologyidentification

基于专利术语的颠覆性技术识别

ezrhy.me

**还有啥？**有嘻哈！写不出押韵？试试这个工具，找个韵脚，就开始你的 freestyle！

fewrel

A Large-Scale Few-Shot Relation Extraction Dataset

final_word_similarity

根据2016年7月论文，综合了词林扩展版与知网Hownet的相似度计算方法，达到了更大的词汇覆盖、更优的效果。

find-chinese-medical-words

发现新词无监督词库生成医学词库生成发现未登录词

github-chinese-top-charts

:cn: GitHub中文排行榜，各语言分设「软件 | 资料」榜单，精准定位中文好项目。各取所需，高效学习。

google-translate-python

Online translation as a Python module & command line tool. No key, no authentication needed.

gpt-crawler

Crawl a site to generate knowledge files to create your own custom GPT from a URL

gpt-tutorial-101

ChatGPT从0到1学习资料汇总，入门/原理/应用/场景/实操，最好的GPT学习中文文档

hanlp

中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现关键词短语提取自动摘要文本分类聚类拼音简繁自然语言处理

hummingbird-tutor

一款找家教（信息发布类）微信小程序，分为四大功能，供家长找家教，家教找家长，智能匹配，个人中心，总代码行近15000行，功能很全，具有投诉建议、收藏、发送申请、抽奖、转发赠送申请次数、用户指引、家长注册、教师注册、图片上传实时删除等功能，具有新消息提醒、地图、重力感应、等等创新性功能，并且因为微信自带的选择器太丑，本人创新性的自己开发了选择器，让用户体验更佳，以及仿照微信开发的图片上传及实时删除功能，这些组件都是可以复用的，非常适合拿来学习，或者是直接商用

igan

Interactive Image Generation via Generative Adversarial Networks

ipproxypool

IPProxyPool代理池项目，提供代理ip

jiagu

Jiagu深度学习自然语言处理工具知识图谱关系抽取中文分词词性标注命名实体识别情感分析新词发现关键词文本摘要文本聚类

seekertrue Goto Github PK

seekertrue's Projects

Recommend Projects

Recommend Topics

Recommend Org