Giter Club home page Giter Club logo

sound-of-pixels's People

Contributors

hangzhaomit avatar maximksh avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar

Watchers

 avatar

sound-of-pixels's Issues

Мультипликация датасета

Подготовка:

  1. Скачать датасет. Предобработанный https://drive.google.com/file/d/1WF0W9qWWsgPoAAxi4akHJ1kk2BEzYhAr/view?usp=sharing
  2. Распаковать его в репозиторий data/frames и data/audio
  3. Выполнить python3 scripts/create_index_files.py. Оригинальный скрипт разбивал по-простому, в статье указывалось, что разбиение производилось train=solo+duet, val=solo, test=duet, поэтому пришлось его допилить.
  4. запускаем обучение scripts/train_MUSIC.sh

Результаты работы кладуться в ckpt/<зависит от параметров>/visualization

Проблема:
Согласно стандартным настройкам, на каждой эпохе выполняется дублирование датасета "--dup_trainset 100" (значение по умолчанию, задано в arguments.py). Если же учится по одному проходу, то все гораздо грустнее

Проблема с кривыми видео на выходе

Подготовка:

  1. Скачать датасет. Предобработанный https://drive.google.com/file/d/1WF0W9qWWsgPoAAxi4akHJ1kk2BEzYhAr/view?usp=sharing
  2. Распаковать его в репозиторий data/frames и data/audio
  3. Выполнить python3 scripts/create_index_files.py. Оригинальный скрипт разбивал по-простому, в статье указывалось, что разбиение производилось train=solo+duet, val=solo, test=duet, поэтому пришлось его допилить.
  4. Качаем scripts/download_trained_model.sh, затем запускаем scripts/eval_MUSIC.sh

Результаты работы кладуться в ckpt/<зависит от параметров>/visualization

Проблема:
При стандартных настройках (указаны в train_MUSIC.sh и eval_MUSIC.sh) берется три кадра (--num_frames 3) с шагом 24 (--stride_frames 24). Видео на выходе получается 9 секунд по заголовку, по факту 6 секунд и кадр там не меняется вообще. Аудио при этом нормальное, на 6 секунд (5.9), если быть точным. Если ставить меньше stride и больше num_frames, то кадры начинают меняться.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.