Skip to content

이진 함수에서 Odds를 K개 Class로 일반화하는 과정이 이해가 가지 않습니다. #1071

@csmhub

Description

@csmhub

Tensorflow 101의 16번째 강의를 듣는 과정에서 Softmax와 Sigmoid 함수의 차이점을 숙제로 받아 공부하고 있는 중 문제가 발생했습니다.

해결하고자 하는 문제

Softmax 함수를 유도하는 과정에서, 이진 함수의 Odds를 K개의 클래스가 있는 함수로 변환하는 부분이 이해가 가지 않습니다.
스크린샷 2021-01-07 오후 4 17 37

시도해본 방법

저는 Odds가 다른 확률비이므로, K개의 클래스가 있을 때 Odds는 아래처럼 나와야 한다고 생각했습니다.
image
예를 들어 5개의 클래스가 있다고 치면, 첫 번째 클래스의 Odds는 "(첫 번째 클래스)/(나머지 클래스 확률 합)" 형태가 나와야 한다고 생각했습니다.

그런데 위 식은 K번째 클래스의 확률만 고려해서 Odds를 구하고 있는 것 처럼 보입니다. '그러면 그냥 K번째 클래스를 기준으로 나머지 확률의 비를 표현하게 되는 건가요?' '그렇다면 굳이 K번째일 이유도 있지 않나요?' 'K클래스의 확률이 심각하게 작거나 클 때 다른 확률을 표현하는 데에 문제가 생기지 않나요?' 등의 생각이 꼬리에 꼬리를 물고 올라왔습니다.

간단히 말해서, 첫 번째 사진에서 설명하는 원리를 잘 이해하지 못하겠습니다.

여기는 제가 공부하면서 필기해 놓은 내용입니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions