Giter Club home page Giter Club logo

tudien's Introduction

Từ điển tiếng Việt dành cho máy đọc sách Kindle, Kobo, Pocketbook v.v.

Mã nguồn cho từ điển dành cho máy đọc sách Kindle. Để sử dụng từ điển, download tại đây http://catusf.github.io/.

Ghi chú

SSH Private Key

  • Khi tạo khởi động CodeSpace để dev, thực hiện lệnh sau để đồng bộ SSH Private Key từ CodeSpace secret vào SSH Agent
eval $(ssh-agent -s) 
ssh-add <(echo "$SSH_PRIVATE_TUDIEN_CODESPACE") 

Submodules

  • Sau đó sync submodule về bằng lệnh
git submodule update --init --recursive

Tại sao?

Do tôi thấy cần:

  • Có các từ điển có chất lượng để giúp việc học hỏi của bản thân và mọi người
  • Lập trình viên bất kỳ có thể dùng dữ liệu đầu vào ở đây để tạo output khác
  • Có thể dễ dàng bổ sung từ điển - chỉ cần tạo 1 file văn bản phân cách bằng dấu \t (.tab) và 1 file mô tả .dfo

Các từ điển cần:

  • Chính xác và dễ tra cứu
  • Dùng được trên nhiều thiết bị (Kindle, Kobo, Onyx, mobile và PC apps)

Các bước cách tạo ra file từ điển

  1. Cài Python 3.x
  2. Tạo mới hay sửa file định nghĩa từ điển (như ../dict/TudienAnhVietBeta.tab)
  3. Chạy dòng lệnh createhtml.bat để tạo ra các file .html (có format OPFcho ebook ebook) dùng chương trình Python tab2opf.py
  4. Sửa file .opf nếu cần (tham khảo các file *-org.opf)
  5. Chạy createmobi.bat để tạo từ điển Kindle sử dụng công cụ mobigen.exe của Amazon. Các từ điển nằm trong thư mục ../dict

Việc còn lại là copy file .mobi vừa được tạo ra bằng dây cáp USB vào thư mục documents trên Kindle để bắt đầu sử dụng.

graph LR;
    GenMetadat(File mô tả <.dfo>) --> GenTab(File định nghĩa <.tsv>);
    GenTab -- tool tab2opf --> HTML_File(File <.opf/html>) -- mobigen --> KindleDict(Từ điển Kindle <.mobi>);
    GenTab -- chạy PyGlossary --> EpubDict(Từ diển <.epub>);
    GenTab --  chạy PyGlossary --> KoboDict(Từ diển Kobo <.kobo.zip>);
    GenTab --  chạy PyGlossary --> StarDict(Từ diển StarDict <.ifo>);
    GenTab --  chạy PyGlossary --> dictd(Từ diển dictd <.index>);
    GenTab --  chạy DSL Tools --> DSLDict(Từ diển Lingvo <.dsl.dz>);
Loading

Danh sách các từ điển và số từ hiện có

  1. Từ điển Hán Việt Thiền Chửu (9'897)
  2. Từ điển Anh Việt Beta (106'059 với 28'400 dạng từ thay thế - inflection)
  3. Từ điển phật học tổng hợp (49'569)
  4. Từ điển Phật Quang (16'973)
  5. Từ điển Phật học Việt Anh - Thiện Phúc (24'767)
  6. Từ điển Phật học Anh-Hán-Việt (3'914)
  7. Ngữ vựng Danh từ Thiền học (302)
  8. Từ điển Đạo Uyển (3'262)
  9. Từ điển Phật học Việt Anh - Đồng Loại (7'847)
  10. Từ điển Phật học Việt Anh - Minh Thông (9'113)
  11. Phật Quang Đại từ điển (Hán ngữ) (22'900)
  12. Rộng mở tâm hồn (1'347)
  13. Từ điển Phật học Tinh tuyển (2'918)

Chat với tác giả

Join the chat at https://gitter.im/catusf/tudienanhviet

Release all dictionaries

tudien's People

Contributors

catusf avatar catusphan avatar gitter-badger avatar ilius avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

tudien's Issues

Cảm ơn bạn

Hi bạn,

Bộ từ điển này rất hay, mình muốn cảm ơn bạn. Bạn có twitter hay gì để mình follow được ko ?

Thêm dictd format

Mình vừa chuyển sang dùng plato và bọn này chỉ hỗ trợ dictd format, mong bạn build thêm bản của dictd.

Vấn đề khi tra cứu từ điển trên Kindle

Rất cám ơn bạn khi đã tạo ra một từ điển hữu dụng như vậy. Nhưng mình cũng có một vấn đề rất khó chịu là khi tra cứu trên Kindle, nhiều từ tiếng anh trong câu thường theo sau bởi dấu phẩy hoặc dấu chấm, khi mình chạm trên màn hình thì nó sẽ chọn cả từ bao gồm cả dấu phẩy ví dụ good, , những lúc này nó sẽ không hiển thị ý nghĩa. Tất nhiên là sẽ có thể kéo để chọn lại nhưng cái thao tác chọn lại đoạn text trên Kindle rất giật khó khăn và đôi khi bạn còn chọn nhầm sang từ khác. Mong bạn có thể xây dựng để nó tra được cả những từ có dấu phẩy đằng sau được không ?

Build file cho Stardict

Thực sự từ điển này rất hay do có chức năng tìm các mục từ biến thể, nên mình muốn có một bản cho Stardict hoặc Goldict.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.