mishima-syk / py4chemoinformatics Goto Github PK
View Code? Open in Web Editor NEWPython for chemoinformatics
License: Other
Python for chemoinformatics
License: Other
CC BY-NC-SAでよいと思うけど?
https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ja
いくつかの異なる製薬企業で同じターゲットが骨格かぶっているかいないかの例に変更する
小さくするか作り直す
ch10 導入の説明がわかりにくい、いきなりニューラルネットの層の話をされても初心者には全くわからない
ZINCのデータを使ってLBVSをやってみるというサブセクションを類似性の章に入れるのを検討する
Anacondaのインストール方法
『アナコンダの公式サイト』ってここだけ急に日本語!
『ついでLinuxであれば』の前に謎のスペースが!
インストールしたパッケージの説明、RDKit
オープンソースソフトウェア(OSS) -> "("が全角、")"が半角。最初の"("を半角にすれば気にならない
git
『本書ではgitについては説明しませんのでもしGitについて全然知らない』 タイトルも含め、git, Gitが混在してましゅ
Condaについてもう少し詳しく
『本書執筆時点でconda-forgeで配布されているRDKitのパッケージが要求するPythonのバージョンが3.6となっています』 なんか気になる
「である調」か「ですます調」に統一する必要がある。
図入りで説明しておいたほうがいいの?
・「RDKitで構造情報を取り扱う」の最初に本章のJupyter notebookへのリンクがあり、
とても便利と感じました。他の章でも、同様のリンクがあれば更に便利だと思いました。
・各セルの出力内容の記載がある場合とない場合があり類推して読むことがありました。
以下は個人的要望ですので参考程度でかまいません。
・個人的に、この入門書を読んだ後に読み進むべき文献や勉強方法があると感激します。
・実際の業務での流れの一例(解説した章のまとめになるもの?)があると感激します。
ケモインフォマティシャンが周りにいない人(自分ですが)は、実際に行われた流れ(に近いもの)があれば、
とても勉強になりますし、こういう話は集会に参加することでしか得られない情報となりがちで貴重に思います。
ChEMBLのデータのダウンロードのやり方とか検索の仕方の説明必要?
メディシナルケミストに統一したほうがよいかも
そういう領域に対してもAIと呼ばれるものが進出がここ数年(2017-2019)で急速に進みました。
↓ こうでしょうか?
そういう領域に対してもAIと呼ばれるものの進出がここ数年(2017-2019)で急速に進みました。
It is useful for translate the document from Japanese to English for some people....
This is not issue, just memo.
要る?
graphvizで章を読む順番のグラフを用意したい
ch番号しか変わってない
みなさま、執筆お疲れ様です。
先日のMishima.sykではお世話になりました。
ケモインフォは素人ですが、非常に読みやすく、一気に読み通せました。
幾つか気になった点があったので、フィードバックしてみます。
F1スコア、R2スコアの計算結果・値は見れないですか?AsciidocはMarkdownだから、コマンドの評価した結果は見れないですかね?
最大共通部分構造Maximum Common Substructure(MCS)探索はケモインフォマティクスの分野でよく利用される手法です。これは、類似性探索、クラスタリング、分子のアライメントなどに有効です。
はMCSを説明していない
実行した結果、どういうことがわかるのかの説明が欲しいです
なんかいいアイコンとかないかな?
https://github.com/Mishima-syk/sklearn-tutorial
にリンクを張ろうと思うので載せましょう
この先どうすればいいかとかの指針などを追加しておく
化合物デザインはイノベーティブ
『どのような化合物を作るべきか?、またそれをどのように化合物を合成するか?』
『どのような化合物を作るべきか?、またそれをどのように合成するか?』?
化合物関連データベースの歴史
公開データベースがないという状況はオープンネスを失わせる要員の一つでした
要因
おまけ2
全体で『ケモインフォマティクス』と統一されているので(たぶん)、
『chemoinformatics, bioinformaticsと括る』のところが毎度気になります。気にしすぎ?
Chemoinformatics or Bioinformatics? はもちろんそのままで良いと思いますし、これに沿った記載なのかも知れませぬが…
画像がないと何言ってるかわからん
キナーゼ阻害剤を例にしてシャッフリングする例を追加するといいような気がする
SMILESとFPの説明とそれらの違いを丁寧に説明する必要がある
typo
データ探して書く
全体を通して、句点がある/ないセクションが混在していて気になります…
みんなのPython 第4版
Javascript,Java カンマ後に半角スペースが欲しい
その他ローカルコミュニティなど
『勉強会やコミュニティのあつまり』 -> 『勉強会やコミュニティの集まり』
udemy/python
『周りの評判を効いてみても』 -> 『周りの評判を聞いてみても』
Qiita
『大抵答えが見つかるとはず』突然のヒロシ調! -> "と"を削除、『大抵答えが見つかるはず』
Jupyter notebookで便利に使おう 以降、Pythonで機械学習をするために も
Jupyter notebook, jupyter notebook が混在していて気になる。別に気にならないなら放置でも。本質とは関係ないし。
Pythonで機械学習をするために
chemoinformatics カタカナ表記で統一かと思ってたけど違うのかしら?
chemoinformatics,bioinformatics の部分、カンマの後ろに半角スペースが欲しいです
Fraggle Similarityが突然出てきて何の役に立つのかわからない
以下の二つを追加するのはいかがでしょうか?
分かる人にしかわからない。初心者向けの説明に変える
なぜ仮想環境を作るのでしょうか?
2つの分子を例に上げているけど一つでない理由は?
page 44 : KerasとTensorflowでどちらがどちらを内包している関係なのかがわかりません。Kerasの中でTensorflowが動いているのか、TensorflowがKerasを動かしているのか?
page 44 : 隠れ層が"分岐"というところがあまりイメージできませんでした。1つのシナプスが次のレイヤーの複数のシナプスにつながるところですか?深層学習では一般的に言われているフレーズでしょうか?
page 51 : Epochsは増やしすぎると過学習するというのは知らなかったのですが、何か参考文献はありますか?
page 53 : DNNが自動で特徴量を作るという説明(例えば画像でSIFTを使わずPrimitiveなデータ(ピクセル?)のまま古典的な機械学習手法を使うとうまくいかなかったのでしょうか?変数選択はあらゆる機械学習手法が自動でやってそうですが)
具体例があったほうがいいです。
sdfファイルがありません
2章のconda仮想環境構築の必要性は初心者にわからないので説明を入れるか削除するかどちらかの対応を行ったほうがよろしいと思います。
図入りできちんと説明しないとわからないじゃないでしょうか?
リポジトリには含めているけどpdfには表記されていないのでライセンスのサブセクションを追加する
最近では日本語での解説サイトも増えてきており初学者の導入のハードルも低くなってきています。
インストレーションの章で説明すること?
QMとかSBDDにつながるようなデータベースの説明は必要か?
4章でせつめいしたのでそちらに沿った形に書き換える
生成モデルに関する説明を加えたほうがよい
ch06 で
今回はこのECFP4(Morgan2)を利用した類似性評価をしてみましょう。
と書いてありますが
apx_fp = AllChem.GetMorganFingerprint(apx, 2, useFeatures=True)
rvx_fp = AllChem.GetMorganFingerprint(rvx, 2, useFeatures=True)
と、 useFeatures=True
となっており FCFP4
で計算されていると思います。
あと Jupyter Notebook の方では
fp1 = AllChem.GetMorganFingerprint(mol1, 2, useFeatures=True)
fp2 = AllChem.GetMorganFingerprint(mol2, 2, useFeatures=True)
DataStructs.TanimotoSimilarity(fp1, fp2)
と書かれてこちらも useFeatures=True
となっています。
PDFの方では fp1
, fp2
を発生させるところは省略されていますがこれは意図しているのでしょうか?
ミスでしたら追加してあげた方が良いと思いました。いかがでしょう?
sklearnチュートリアルをちゃんと動くようにしてきちんと注釈つけたらリンクを張る
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.