Comments (3)
@CoodingPenguin 완전 이해됐습니다! p 분포가 고정일 때는 CE 나 KL 이나 둘 다 loss 로 잡아도 다를게 없는데 distillation loss 의 경우 p 분포가 바뀌기 때문에 KL 을 쓰는군요! 감사합니다 ㅎㅎ
from peer-session.
@Heeseok-Jeong 슬랙에 KL과 CE 차이에 대한 답변이 있었네요! 관련 링크 남깁니다. 잘 설명해 놓은 자료를 발견해 이어서 추가로 링크 달아놓겠습니다!
- https://stats.stackexchange.com/questions/265966/why-do-we-use-kullback-leibler-divergence-rather-than-cross-entropy-in-the-t-sne
- https://stats.stackexchange.com/questions/357963/what-is-the-difference-cross-entropy-and-kl-divergence
참고로 CE와 KL은 다음과 같은 관계를 같는다고 합니다.
from peer-session.
@bsm8734 8-4번 질문에서 제가 양자화를 하면 범위가 더 커진다고 말씀드렸는데 다시 보니 아니네요. 죄송합니다ㅠㅠ
양자화를 한다는 것이 어찌보면 trucated하는 것과 비슷하기 때문에 범위가 위와 같이 엄청 넓어지기는 힘듭니다.
코드를 보니 양자화 때문이라기 보다는 dequantize로 인해서 그렇게 된 것 같은데 자세한 이유는 잘 모르겠네요.
from peer-session.
Related Issues (20)
- [DAY 34] Instance/Panoptic segmentation and landmark localization & Conditional Generative Model
- [DAY 35] Multimodal captioning and speaking & 3D understanding HOT 1
- [원딜] pth → onnx → pth 순으로 모델을 저장할 때 마지막 pth 파일의 크기가 커지는 이유?
- [DAY 36] Lightweight models & The flip-side of the coin: on-device AI & Optimization
- [원딜] Gaussian Process HOT 2
- [DAY 37] Timespace of ML model & Compression
- [DAY 38] Acceleration & Pruning for network compression
- [DAY 40] Low-rank approximation for model compression & Retrospect
- [DAY 24] 정점 표현 & 추천시스템 (심화) HOT 1
- [히스] CNN 과 GNN HOT 1
- [DAY 25] GNN 기초 & GNN 심화 HOT 1
- [DAY 27] 서비스 향 AI 모델 개발하기 & AI 시대의 커리어 빌딩
- [DAY 28] 캐글 그랜드마스터의 경진대회 노하우 대방출 & Full Stack ML Engineer
- [DAY 29] 자연어 처리를 위한 언어 모델의 학습과 평가 & 내가 만든 AI 모델은 합법일까?
- [DAY 30] AI + ML 과 Quant Trading & AI Ethics
- [DAY 31] CV - 이미지 분류 1 & 적은 수의 데이터를 효율적으로 학습하는 방법
- [DAY 32] CV - 이미지 분류 2 & Semantic segmentation
- [DAY 33] Object detection & CNN Visualization
- [샐리] (CV, CH06) Faster RCNN - class layer의 파라미터 수가 2k인 이유
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from peer-session.