seekertrue Goto Github PK
Type: User
Type: User
利用网络爬虫技术,从国内外各大高校公开的网站和资源上,搜寻并下载各个高校专家,教授等学者信息,并为这些学者研究方向建立画像系统。用户可以按学校,专业,学科,论文,研究方向等各个维度去查看和对比各位学者的研究领域信息。 基本模块:专家数据爬取模块,论文信息爬取模块,基于专家画像的信息抽取,专家搜索引擎,研究方向提取,专家自我网络中主题圈发现,数据可视化
study code clone
越来越多的网站具有反爬虫特性,有的用图片隐藏关键数据,有的使用反人类的验证码,建立反反爬虫的代码仓库,通过与不同特性的网站做斗争(无恶意)提高技术。(欢迎提交难以采集的网站)
🆓免费的 ChatGPT 镜像网站列表,持续更新。List of free ChatGPT mirror sites, continuously updated.
这儿收集了一些免费好用的ChatGPT镜像站 当前:55个站点
ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型
🔮 ChatGPT Desktop Application (Mac, Windows and Linux)
基于大模型搭建的微信聊天机器人,同时支持微信、企业微信、公众号、飞书接入,可选择GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/LinkAI,能处理文本、语音和图片,访问操作系统和互联网,支持基于自有知识库进行定制企业智能客服。
ChatterBot is a machine learning, conversational dialog engine for creating chat bots
Tools and resources for Chinese texts preprocessing. Validated in two papers, one CCF C, EI indexing and one CCF B, SCI indexing.
轻量中文押韵神器,100%绝对可用,傻瓜式命令行操作,秒速实现烈焰单押,闪电双押,龙卷三押以及海啸式四押,目前版本 v0.2.6。Search for rhymes for Chinese words, with 1, 2, 3 and 4 characters, released on PyPI with current version of 0.2.6.
Chinese word segmentation algorithm without corpus(无需语料库的中文分词)
文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据**知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取前3000个词语形成语义词典,然后根据观察设置停用词。然后再用TF-IDF的方式对每个摘要进行词频选取,通过布尔模型,对比语义词典生成文本向量。然后对标签进行数字化转换。取90%的文本为训练集,10%的文本为测试集。用有监督学习的SVM算法对文本进行分类,(人类生活必需品、作业运输、化学冶金、纺织造纸、固定建筑物、机械工程、物理学、电学)分成8类
中文押韵工具。
A concept and obvious expression pattern collection of Chinese compound event extraction which then be evolved into ComplexEventGraph,本项目提出了中文复合事件的概念与显式模式,包括条件事件、因果事件、顺承事件、反转事件等事件抽取,并形成事理图谱。
CookiesPool Based on Redis
基于专利术语的颠覆性技术识别
**还有啥?**有嘻哈!写不出押韵?试试这个工具,找个韵脚,就开始你的 freestyle!
A Large-Scale Few-Shot Relation Extraction Dataset
根据2016年7月论文,综合了词林扩展版与知网Hownet的相似度计算方法,达到了更大的词汇覆盖、更优的效果。
发现新词 无监督词库生成 医学词库生成 发现未登录词
:cn: GitHub中文排行榜,各语言分设「软件 | 资料」榜单,精准定位中文好项目。各取所需,高效学习。
Online translation as a Python module & command line tool. No key, no authentication needed.
Crawl a site to generate knowledge files to create your own custom GPT from a URL
ChatGPT从0到1学习资料汇总,入门/原理/应用/场景/实操,最好的GPT学习中文文档
中文分词 词性标注 命名实体识别 依存句法分析 语义依存分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁 自然语言处理
一款找家教(信息发布类)微信小程序,分为四大功能,供家长找家教,家教找家长,智能匹配,个人中心,总代码行近15000行,功能很全,具有投诉建议、收藏、发送申请、抽奖、转发赠送申请次数、用户指引、家长注册、教师注册、图片上传实时删除等功能,具有新消息提醒、地图、重力感应、等等创新性功能,并且因为微信自带的选择器太丑,本人创新性的自己开发了选择器,让用户体验更佳,以及仿照微信开发的图片上传及实时删除功能,这些组件都是可以复用的,非常适合拿来学习,或者是直接商用
Interactive Image Generation via Generative Adversarial Networks
IPProxyPool代理池项目,提供代理ip
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要 文本聚类
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.