crisale84 / labgen Goto Github PK
View Code? Open in Web Editor NEWGenómica Poblacional con RADs, cluster Miztli, UNAM
Genómica Poblacional con RADs, cluster Miztli, UNAM
a) La carpeta RADcap, contiene los scripts para hacer un ensamble de secuencias de ADN asociadas a los sitios de restricción enzimática (RADseq), de tipo RADcap, estos scripts se ejecutan en Miztli o en cualquier computadora con sistema operativo linux. d) Análisis de estructura poblacional usando el software Structure en la supercomputadora Miztli: 1.- Copia la carpeta software_structure de mi $HOME a tu espacio de trabajo. 2.- Dentro de la carpeta encontrarás la consola que contiene los siguientes archivos: extraparams mainparams pops2numb.sh structure structure.sh El archivo pops2numb.sh te permitirá cambiar la notación de missing data a la reconocida por Structure (-9), por lo que primero deberás copiar el archivo populations.structure a esta consola: cp ~/populations_output/populations.structure . Y posteriormente ejecutar : ./pops2numb.sh En la pantalla observarás el número de loci que contiene tu archivo populations.structure 3.-Abre mainparams con nano y deberás reemplazar: #define MAXPOPS XX // por el número de poblaciones totales que se analizaron en tus datos y se define desde tu popmap.tsv de Stacks // puedes usar: cat populations.structure | cut -f2 |sort |uniq #define BURNIN 100000 // cien mil réplicas de burning #define NUMREPS 200000 // doscientos mil iteraciones #define NUMLOCI XXX //por el número de loci que arrojó pops2numb.sh #define NUMINDS XXX //por el número de individuos en tu archivo, que es igual al número de columnas en populations.structure.modified.tsv entre dos Guarda este archivo sobre-escribiendo el nombre mainparams 4.- Ejecuta: cat populations.structure| cut -f2 | sort |uniq y utiliza ese output para llenar el apartado 3 de pop2numb.sh Con nano, abre: pops2numb.sh nano pops2numb.sh y, en la sección 3, cambia el nombre de las poblaciones por los números que serán reemplazados, observa que existe un 'tab' antes y después de cada población: cat populations.structure.tsv | sed -E \ -e 's/ BocadeCamichin / 1 / ' \ -e 's/ Chametla / 2 / ' \ -e 's/ Cuautla / 3 / ' > populations.structure.modified.tsv Ejecuta: $./pops2numb.sh 5.- Por ultimo, con nano abre structure.sh nano structure.sh En el encabezado, seguido de el signo de gato (#) están los parámetros que leerá Miztli a través de bsub, puedes cambiar todo, aquí te dejo lo básico de básicos, para mayor información puedes seguir la guía de Miztli: #!/bin/bash #BSUB -J strkBco <---- Nombre del Job, solo te permite 10 dígitos #BSUB -q q_residual <---- Nombre de la cola, opciones: q_residual, q_16p_256g , q_32p_256g , q_gpu , q_hpc #BSUB -oo salida.p1 <----- aquí se guarda tu output, si no cambias el nombre se sobre-escribe, por favor cámbialo. #BSUB -eo error.p1 <----- aquí se guardan los errores en tu output, lo mismo, si no cambias el nombre se sobre-escriba, por favor cámbialo. #BSUB -n 6 <----- Número de nodos, nuestro máximo son 32 #BSUB -R "span[hosts=1]" <------ NUNCA LO CAMBIES NI MUEVAS, ESTA LÍNEA CONVERGE TODO EL ANÁLISIS A UN PUNTO DE ENTRADA PARA EL OUTPUT Y QUE NO SE DIFUMINE LA INFORMACIÓN POR DOQUIER, CAMBIARLO PUEDE CAUSAR ERRORES EN LA EJECUCIÓN DE TU SCRIPT EN EL CUERPO DE structure.sh: Cambia el numero de poblaciones por las poblaciones contadas+uno Si gustas puedes aumentar el número de réplicas, yo trabajo con 3! NO CAMBIES NADA MÁS! Guarda con Ctrl+O Ahora si, ejecuta: $bsub < structure.sh Todos los parámetros serán leídos por bsub y ejecutados en Miztli, dependiendo de la cantidad de burning, réplicas que hayas pedido en mainparams y el número de cores y la cola a la que hayas enviado tu trabajo, este script puede tardar algún tiempo... puedes consultar el avance de tu trabajo con: $bjobs o bien, $bjobs 885413 <-------- con el número del Job Una vez terminado se guarda el Job en una carpeta: results_DIA_MES_AÑO.zip Esta la puedes descargar a tu computadora personal y ver los resultados en línea # upload the results.zip file to the web page: http://taylor0.biology.ucla.edu/structureHarvester/ # example of an aplication to obtain a structure plot http://omicsspeaks.com/strplot2/ También puedes ir a esta página http://pophelper.com/ y subir tus archivos .meanQ para obtener los resultados graficados en html :)
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.