croler's People
croler's Issues
Obrisat kod osreckog
Posto smo mijenjali neke strukture da bi se popravio brunin kod, nema smisla sta kod osreckog bude u repozitoriju. Sve sto ne koristimo, treba obrisati.
Brisanje third-party koda za citanje
Pobrisati:
- citanje iz amos banke (qpid)
- citanje iz faste (qpid)
- citanje readova iz banke (layout)
- citanje readova iz .afg (layout)
- citanje iz faste (layout)
qpid nalazi samo 50% readova kada cita iz fastq filea
popravit ./run.sh
Dodati mogucnost da se iskljuci trimanje i bubble popping
Bilo bi dobro se dodaju opcije koje nam omogucuju da iskljucimo trimanje, da definirano koliko puta zelimo pokrenuti trimanje i zelimo li bubble popping.
Recimo
layout --trim 0
za iskljucivanje trimanja
layout --trim 1
za trimanje 10 puta
layout --no-bubble-popping
za iskljucivanje bubble poppinga
Napraviti opciju za passeanje trimming konstante kroz cmd
lib/ThreadPool dodat kao submodule
qpidov ThreadPool treba dodat kao submodule
Dokumentirati qpid-a (overlap fazu)
Pokretanje, algoritam ukratko
popravit ./run.sh da cita .afg
Nakon sto se dovrsi #40, treba popravit i ./run.sh skriptu da pokrene cijeli asembler
Popraviti brunino kreiranje kontiga
Trenutno se kontizi kreirani naopako s obzirom na minimus.
Potrebno inspectati i utvrditi koliko je to oke i kak utjece na rezultate.
Odrediti vrijednosti za maksimalan broj read-ova i maksimalnu udaljenost u bubble-ovima
Dodati mkdir bin u makefile za brahle_assembly i msa
generalni make clean
sve dijelove koda koji nisu nasi izolirat u vendor direktorij
radi lakseg pracanja koda koji nije nas, izolirati sav tudji kod u vendor mapu u rootu projekta.
svi takvi library trebaju ic u vendor direktorij (u rootu), a u dijelovi assemblera koriste samo symlinkaju svoj vendor direktorij na vrsni.
Nakon trimminga se pojave neocekivani readovi u kontizima
Nakon trimminga, u prvom kontigu se pojavljuje read 279, a cini se da on uopce ne bi trebao biti tamo (nema ga u grafovima nakon brisanja tranzitivnih edgeva).
Radi se o primjeru influenze.
Test skripte
Napraviti skripte za testiranje koje ce omoguciit jednostavno pokretanje testova (nas i minimusa).
Napravit zajednicki makefile
Trebalo bi objediniti makefileove u jedan. Svakako treba provjeriti postoji li nacin da se oni pozivaju rekurzivno.
dodat u qpida podrsku za iid-ove koji ne krecu od 0
Zamjena dosadasnjeg citanja readova libraryem (layout faza)
Provjeriti ako se sekvence dobro ekstrahiraju
dodat u qpida podrsku za iid-ove koji ne krecu od 0
Dodavanje citanja iz .afg-a u konsenzus fazu
Promijeniti redoslijed kod linkanja qpida
Posto defaultni gcc na ubuntuu ne postuje redoslijed argumenata iz dokumentacije, treba napravit makefile koji radi i na ubuntuu.
Kad se rijesi issue, neka se ostavi verzija ubuntua i gcc-a na kojem testirano radi.
Ubuntu verzija cat /etc/os-release
gcc gcc -v
napravi bin direktorij za asembler generalno
Testirati faze i dodati rezultate u repozitorij
Komentirati rezultate na malim genomima
Dokumentirati layout fazu
Dodati spremanje logova u ./run.sh
Logove treba spremati uvijek. Rezultati bez logova su nam cesto teski za interpretirati + kada dodamo ispisivanje svih parametara prilikom pokretanja ne moramo pamtiti koji run smo vrtili s kojim parametrima.
cc @mculinovic
Odrediti broj rundi trimminga i bubble poppinga
Skuzit vrste overlapa i vidjet utjecu li na rezultat
https://github.com/mariokostelac/assembly/blob/master/pipeline/brahle_assembly/src/layout/layout_utils.cpp#L160 - cini se jako cudno da svi overlappi izgledaju jednako.
Dodati support za reversane readove u konsenzus
Pregledavajuci kod nabrzaka sam shvatio da se neka sekvence nikada ne komplementirat. Ako je ona naopaka, trenutna implementacija je samo okrene, ali je ne komplementira, sto je bioloski neobjasnjivo i krivo.
grep
ao sam po kodu i shvatio da se rijec complement uopce ne spominje u u codebaseu konsenzusa.
Prilikom svakog pokretanja ispisati vrijednosti svih konstanti
popravit makefile qpida
trenutno ima apsolutne pathove koji matchaju sam na mom docker stroju :)
Dodavanje citanja .afg formata u qpid
Dokumentirati projekt generalno
Pokretanje, formati datoteka, znani problemi itd.
Promjena smjera kretanja u grafu nakon overlapa tipa EE
qpid: dodat support za ucitavanje filea koji definira koji subset id-ova ulazi u obzir
zbog potrebe testiranja, bilo bi dobro da se doda support za ucitavanje filea koji definira koji subset id-ova ulazi u racunanje. tako lako mozemo izolirati par i ispisivati debug info
Napravit docker image s AMOS-om i nasim assemblerom skupa
Nakon validacije HIVa komentirati rezultate.
Grbinov msa dodat kao raw source
Kako bi ga mogli mijenjat, grbinov kod treba takodjer dodat kao raw source. Nebi bilo lose da postoji jedan file .commit u kojem je zapisan hash commita (cisto ako grbin kasnije updatea da mozemo znat koje patcheve trebamo applyat). Isto tako i za brunin kod.
Dodati flag za readove koji nemaju overlapove
Prilikom stvaranja kontiga zasad nema utjecaja ako je read nepovezan, a trebalo bi imati.
Maknuti flag-ove -Wall -Wextra -Werror -pedantic u msa Makefile?
Mislim da se zbog toga neće kompajlirati jer baca error umjesto warning-a za uninitialized vector
qpid ne pronalazi sve vrste readova kao minimus
provjerit dijelove koda u qpidu koji bacaju warninge
./run.sh prepravit tako da kao bazu za ime outputa uzima ime ulaza
Pokretanje s datotekom NIBSC4-5_S13_L001_R_1.afg
bi trebalo stvarati datoteke koje lice na:
NIBSC4-5_S13_L001_R_1_overlaps.afg
NIBSC4-5_S13_L001_R_1_layouts.afg
NIBSC4-5_S13_L001_R_1_contigs.fasta
Ovakav nacin olaksava pokretanje i testiranje.
integrirat amos citanje/pisanje u brunin kod
Ubrzavanje brisanja bridova i čvorova iz grafa
Mislim da je moguće ovo još ubrzati tako da se dodaju neke reference u postojeće strukture. Vidjet ćemo kako će raditi na većim genomima.
popraviti izlaz iz brunine faze
provjerit sto bruno mulja s iid-ovima i indexima
Napraviti lib za citanje readova iz .afg formata
Nakon sto se ovo kvalitetno napravi, mozemo abandonati citanje iz banke i fasta/fastq.
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.