boostcampaitech3 / final-project-level3-cv-02 Goto Github PK
View Code? Open in Web Editor NEW부스트캠프 AI Tech: 내일의집 - 간단한 스케치로, 당신의 가구를 현실로!
부스트캠프 AI Tech: 내일의집 - 간단한 스케치로, 당신의 가구를 현실로!
Replaces #2 partially
담당자: 김주영
5/31(화) 17:00 ~ 6/2(목) 16:00
백엔드에서 사진을 받아서 저장한 다음, 하나의 함수만 실행하면 SDEdit, CNN, ESRGAN을 거쳐 최종 결과물을 보여줄 준비를 마칠 수 있도록 해당 함수를 작성하는 것을 목표로 함
입력: 원본 사진과 스케치 사진의 저장 경로와 크기
SDEdit: 결과 사진 80장 합성 및 제안
CNN: 사용자에게 보여 줄 결과 사진 4장 선택
ESRGAN: 선택된 사진 4장의 해상도를 높여서 저장
출력: 해상도를 높인 사진 4장의 저장 경로
Replaces #2 partially
채택되지 않은 모델이나 프레임워크가 있는 경우, 채택되지 않은 이유와 근거를 포함하여 작성합니다.
담당자: 김주영
현재 모델별로 분리된 모델 코드를 subprocess.call()
함수를 통해 연결해서 사용하고 있는데, 코드에 중복이 많고 성능 상의 비효율이 있어 해당 함수를 사용하지 않는 방향으로 정리하려고 합니다.
담당자: 유환규
5/17(화) 18:00 ~ 5/19(목) 16:00
5/18(수) 16:00 (조기 완료)
실험 결과(이미지)를 슬랙에 공유함
팀원들이 이미지를 같이 본 결과, 그림판으로 4x upscaling한 것보다 ESRGAN을 사용해서 4x upscaling한 것이 훨씬 자연스러웠음. 창문과 창틀의 경계와 같이 인접한 픽셀들이 확연한 색깔 차이를 보이는 경우에는 성능이 좋았고, 베개와 이불의 경계와 같이 색깔 차이가 덜한 경우에는 성능이 조금 떨어졌으나, 여전히 그림판으로 upscaling한 것보다는 훨씬 좋은 결과 이미지를 만들었음.
Replaces #1 partially
담당자: 유환규, 김주영
5/24(화) 18:00 ~ 6/1(수) 16:00
데이터셋 마련은 #35 를 통해서 진행함
담당자 : @Yewon-dev
이미지를 업로드 받는 단계를 위해 주로 다음에 대한 테스트를 수행하는 코드 작성이 필요합니다.
경우에 따라, 프론트엔드(업로드 시도 시점)나 백엔드(업로드 완료 시점)에서 적용해야 합니다.
제목 없음.png
등) 혹은 같은 파일명으로 이미지를 여러 번 업로드할 경우, 같은 이메일로 여러 번 업로드할 경우에도 덮어쓰기 되면 안 됨)담당자: 이수아
5/17(화) 18:00 ~ 5/19(목) 16:00
5/18(수) 16:00
실험을 진행 중임
5/19(목) 16:00
시간이 몹시 오래 걸림
Replaces #1 partially
담당자: 유환규
이미지에 그림을 그렸는데, 그림이 이미지 경계를 넘어가는 경우 이미지가 더 크게 잘릴 수 있습니다.
feat/45 브랜치에 해당 이슈에 대응하는 코드를 업로드했습니다.
담당자: 김주영
담당자: 김주영
5/17(화) 18:00 ~ 5/19(목) 16:00
5/18(수) 16:00
코드에서 발생한 오류를 수정 중임
5/19(목) 16:00
보고된 것처럼 색깔이 반영이 아예 안 되는 건 아닌데, 그게 유의미하기에는 일단 성능이 너무 좋지 않았음
녹색 베개를 합성해 달라고 했는데 베개가 없어지거나 빨간 베개를 합성한 경우가 있었음.
아예 벽으로 덮어지면서 없어지는 물체도 많이 있었음.
창문을 그렸을 때 내가 그린 창틀에 맞춰서 창문을 합성해 주는 것이 아니라, 흔한 창문 사진을 가져와서 잘라서 붙이는 듯한 결과가 나왔음.
5/19(목) 16:00
모델의 성능 관련 논의
색깔이 반영되지 않는 문제는 비즈니스 관점에서 비교적 작은 문제임. 내가 그린 물건이 합성된 사진에서 나타나지 않는 경우가 가장 심각한데, 마침 SDEdit은 여러 가지 합성된 이미지를 제안하므로, 이를 해결하기 위해서 영역별로 기존 사진과 가장 유사도가 낮은 사진의 영역을 가져오는 방법이 있음.
고화질 이미지가 아니더라도 학습을 하는 것이 불리할 것 같지는 않음.
5/20(금) 16:00까지 각자 아이디어를 마련해 오기로 함.
이슈 규칙을 준비하기 전에 작성한 임시 이슈입니다.
관련된 규칙의 적용을 받지 않고, 업데이트되지 않습니다.
5/24(화) 18:00 ~ 6/2(목) 16:00
"영상을 찍어도 되는 상태"에 도달하기 위한 개발 진행
세부적인 목표는 #2 결과에 따라 확정될 예정
담당자: 이수아
5/17(화) 18:00 ~ 5/19(목) 16:00
5/18(수) 16:00
탐색을 진행 중임
5/19(목) 16:00
현실적으로 사용할 수 있는 데이터셋이 없음
학습이 유의미하려면 고화질 이미지를 사용해서 학습시켜야 하는데, 데이터셋의 크기를 고려했을 때 GPU 메모리 용량 문제와 디스크 용량 문제가 반드시 모두 발생할 것임.
Replaces #1 partially
담당자: 이수아
05/21(토) ~ 05/22(일)
See also
https://github.com/ermongroup/SDEdit
담당자: 김주영
5/25(수) 18:00 ~ ASAP
모델의 경우, 이슈 생성 전에 SDEdit이 우월하다는 것이 확인되었으므로 실험 결과를 수집하여 정리만 하면 됩니다.
본 이슈는 모델 학습을 시도한다는 전제 하에 작성되었습니다. (#13 의 성공을 가정함)
테스트 결과와 inference 결과물 tracking 체계는 #29 에서 마련합니다.
Replaces #2 partially
담당자: 전원
별도의 기한을 설정하지 않음
코어 모델로 SDEdit을 채택한 이유를 설명하기 위해서 DALLE-2로 진행했던 실험의 결과를 README에 넣어야 합니다.
Replaces #14 partially
Replaces #2 partially
담당자: 김주영
별도의 기한을 정하지 않음
분류 logit과 cosine similarity의 경우 #34 에서 사용하기로 했으므로, 다른 것을 추가로 마련하는 것을 목표로 함
이슈 규칙을 준비하기 전에 작성한 임시 이슈입니다.
관련된 규칙의 적용을 받지 않고, 업데이트되지 않습니다.
5/17(화) 18:00 ~ 5/19(목) 16:00
팀원들이 이미지를 같이 본 결과, 그림판으로 4x upscaling한 것보다 ESRGAN을 사용해서 4x upscaling한 것이 훨씬 자연스러웠음. 창문과 창틀의 경계와 같이 인접한 픽셀들이 확연한 색깔 차이를 보이는 경우에는 성능이 좋았고, 베개와 이불의 경계와 같이 색깔 차이가 덜한 경우에는 성능이 조금 떨어졌으나, 여전히 그림판으로 upscaling한 것보다는 훨씬 좋은 결과 이미지를 만들었음.
프론트엔드와 연결할 수 있는 방법에 대해서는, 프론트엔드를 맡은 팀원도 관련 공부를 충분히 마칠 수 있도록, 팀 전체가 자신의 파트를 공유하는 날을 따로 잡고, 그 날 공유하기로 했음.
학습이 유의미하려면 고화질 이미지를 사용해서 학습시켜야 하는데, 데이터셋의 크기를 고려했을 때 GPU 메모리 용량 문제와 디스크 용량 문제가 반드시 모두 발생할 것임.
녹색 베개를 합성해 달라고 했는데 베개가 없어지거나 빨간 베개를 합성한 경우가 있었음.
아예 벽으로 덮어지면서 없어지는 물체도 많이 있었음.
창문을 그렸을 때 내가 그린 창틀에 맞춰서 창문을 합성해 주는 것이 아니라, 흔한 창문 사진을 가져와서 잘라서 붙이는 듯한 결과가 나왔음.
이수아: 프론트엔드 파트의 백엔드 파트로의 진행 상황 공유는 주말까지 웹페이지 작업을 좀 더 한 다음에 진행하는 것이 좋겠음
색깔이 반영되지 않는 문제는 비즈니스 관점에서 비교적 작은 문제임. 내가 그린 물건이 합성된 사진에서 나타나지 않는 경우가 가장 심각한데, 마침 SDEdit은 여러 가지 합성된 이미지를 제안하므로, 이를 해결하기 위해서 영역별로 기존 사진과 가장 유사도가 낮은 사진의 영역을 가져오는 방법이 있음.
고화질 이미지가 아니더라도 학습을 하는 것이 불리할 것 같지는 않음.
5/20(금) 16:00까지 각자 아이디어를 마련해 오기로 함.
이슈 규칙을 준비하기 전에 작성한 임시 이슈입니다.
관련된 규칙의 적용을 받지 않고, 업데이트되지 않습니다.
6/2(목) 17:00 ~ 6/5(일) 24:00
6/6(월) 11:00까지 피드백을 받기 위한 발표 영상을 제출해야 함
"마지막 피드백을 받기 위한 상태"에 도달하기 위한 개발 진행
세부적인 목표는 #3 결과에 따라 확정될 예정
담당자: 김주영
5/20(금) 17:00 ~ 5/20(금) 24:00
See also
https://github.com/ermongroup/SDEdit
담당자: 김예원
5/17(화) 18:00 ~ 5/19(목) 16:00
5/18(수) 16:00
FastAPI 공부에 많은 진전이 있었음
프론트엔드와 연결할 수 있는 방법에 대해서는, 프론트엔드를 맡은 팀원도 관련 공부를 충분히 마칠 수 있도록, 팀 전체가 자신의 파트를 공유하는 날을 따로 잡고, 그 날 공유하기로 했음.
5/19(목) 16:00
FastAPI를 사용해 보면서 도커 이미지가 있어서 사용해 보려고 했는데, 도커에서 너무 많은 오류를 겪어서, 도커를 사용하지 않는 방법으로 다시 연습해 보고 있음
이수아: 프론트엔드 파트의 백엔드 파트로의 진행 상황 공유는 주말까지 웹페이지 작업을 좀 더 한 다음에 진행하는 것이 좋겠음
Replaces #1 partially
이슈 규칙을 준비하기 전에 작성한 임시 이슈입니다.
관련된 규칙의 적용을 받지 않고, 업데이트되지 않습니다.
6/6(월) 11:00 ~ 6/9(목) 24:00
6/10(금) 17:00까지 최종 발표 영상을 제출해야 함
피드백 결과를 반영하기 위한 개발 진행
세부적인 목표는 #4 결과에 따라 확정될 예정
담당자: 김주영
현재 이슈 및 PR 템플릿은 없으나, 담당자, 날짜, 설명, 할 일 순으로 간단하게 정리하는 것이 정착되었습니다.
이것을 템플릿으로 만들고자 합니다.
담당자: 이수아
05/18(수) ~
이슈 규칙을 준비하기 전에 작성한 임시 이슈입니다.
관련된 규칙의 적용을 받지 않고, 업데이트되지 않습니다.
5/19(목) 18:00 ~ 5/24(화) 16:00
"제출을 할 수는 있는데 부족한 상태"에 도달하기 위한 개발 진행
세부적인 목표는 #1 결과에 따라 확정될 예정
5/20(금) 16:00
학습을 통한 모델 성능 개선은 #13 을 통해서 진행함
원래 당일 논의하기로 하였으나(decided by #20) 미뤄짐
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.