-
Notifications
You must be signed in to change notification settings - Fork 51
Open
Milestone
Description
Tensorflow 101의 16번째 강의를 듣는 과정에서 Softmax와 Sigmoid 함수의 차이점을 숙제로 받아 공부하고 있는 중 문제가 발생했습니다.
해결하고자 하는 문제
Softmax 함수를 유도하는 과정에서, 이진 함수의 Odds를 K개의 클래스가 있는 함수로 변환하는 부분이 이해가 가지 않습니다.
시도해본 방법
저는 Odds가 다른 확률비이므로, K개의 클래스가 있을 때 Odds는 아래처럼 나와야 한다고 생각했습니다.
예를 들어 5개의 클래스가 있다고 치면, 첫 번째 클래스의 Odds는 "(첫 번째 클래스)/(나머지 클래스 확률 합)" 형태가 나와야 한다고 생각했습니다.
그런데 위 식은 K번째 클래스의 확률만 고려해서 Odds를 구하고 있는 것 처럼 보입니다. '그러면 그냥 K번째 클래스를 기준으로 나머지 확률의 비를 표현하게 되는 건가요?' '그렇다면 굳이 K번째일 이유도 있지 않나요?' 'K클래스의 확률이 심각하게 작거나 클 때 다른 확률을 표현하는 데에 문제가 생기지 않나요?' 등의 생각이 꼬리에 꼬리를 물고 올라왔습니다.
간단히 말해서, 첫 번째 사진에서 설명하는 원리를 잘 이해하지 못하겠습니다.
여기는 제가 공부하면서 필기해 놓은 내용입니다.
Metadata
Metadata
Assignees
Labels
No labels