오늘은 과외하는 입장에서 부호화 옵슛 목적론을 다시 읽어봄
게시글 주소: https://orbi.kr/00018682751
과제 : 왜 확률이 낮은 기호에 비트가 많은 부호를 할당하는지 이해해볼것
이거 오늘 발견하고 소름돋음
아... 앞부분이 이해되면 저절로 그냥 정리가된다는 것을 알고 소름..
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
여기가 그렇게 맛있다고 해서... 제가 아는 유달리는 좀 다른거긴 한데 뮤튼 기대가 됩니다 ㅎㅎ
확률이 높은 기호에 비트가 적은걸 할당해야 총사용하는 비트가 줄어드니까 맞나여
맞을거임 배경지식상 암튼 그럼ㅎ
ㄴㄴ 확률이 낮다는 정보량이 많으니 비트도 당연히 올라가야죠
지문이 기억 안나서 그냥 생각해본건데 확률이 낮은 기호는 별로 안쓰이니까 비트가 많은걸 할당하고 확률이 높은 기호는 자주 쓰이니까 비트가 낮은걸 할당해서 총 사용하는 비트를 줄여서 효율적으로 만드는거 아닌가요?
그럴수도 있죠 그게 엔트로피 부호화 아닌가요. 그리고 엔트로피의 개념은 mvue이라는 통계학 개념을 배워야 제대로 알수있음. mvue가 바로 엔트로피 부호화임.

앆... 깊숙이 들어가면 모릅니다 흑맛만 보여주자면 그걸 알면 어떤 것에 대해 중요한 정보를 다 알 수 있다는 것? 그러니까 확률을 추정할 때 결국 중요한 것은 총 시도 횟수 대비 성공 횟수니까 몇번째에 성공했고 실패했고는 다 부수적인 정보니까 그걸 다 제거하고 비율만 계산하면 된다는 느낌?
평균맞추려고?
옵슛 현장에선 몰랐는데 ㄹㅇ 좋은지문임
문제도 어려웠으면 평균 좀 내려갔을거같음
ㅇㅇ 문제의식을 통해서 엮어내면 그렇게 명쾌한게 없음
현장에선 많이 나오는 거엔 많이 나오니 용량 작게 하고 적게 나오는 거엔 용량 크게 해주면, 데이터 작아지니 이득 이렇게 생각하고 풀었는데../
4x3+ 5x1 이 5x3+4x1보다 용량 작으니! 라고 옆에 대충 쓰고 ㅋㅋㅋ
엔트로피랑 밀접한 관련이 있는 것으로 기억
발생 확률이 낮은 기호는 정보량이 많은 기호인데, 기호의 정보량이 많은 만큼 부호로 변환할 때 많은 양의 비트 수가 필요할 것이고, 따라서 발생 확률이 낮은 기호에는 비트 수가 많은 부호를 할당한다....맞나요?ㅠ
약간 억지일 것 같은 뇌피셜 첨언하자면 a란 기호가 발생 확률이 높으면 a가 적어도 딴 애보단 몇번쯤은 더 나오겟지라고 이미 예측해서 정보를 판단하는데 에너지를 아끼려고(?), 혹은 a가 나와봣자 심드렁(?), a가 나올거라는 것은 나도 알고 너도 알고 어차피 다 알만한거기에, 덜 놀라기 때문에(말이 점점 더 이상해지는군요...), 아무튼 딴거보단 좀 더 확실하기에, 즉 엔트로피(불확실성)를 줄이려고 정보량이 적도록 설정하고,
b란 기호가 발생 확률이 낮다면 얘는 딴 애보다 적게 나오니 놓칠 수도 있다싶어서, 혹운 b가 나오면 오 레어템이 나오다니(???)라는 마음에, b를 놓치지 않기 위해(=예측 효율 향상+엔트로피 최소화 두 목적을 달성하기 위해) 정보량이 많도록 설정한 것이 아닐까 뇌피셜해봅니다... 통계에 대해 아는게 거의 없어서 정말 모르겟네요..
맞는 판단인지 확인부탁드려요
엔트로피랑 최대한 가까이 맞추려면 최솟값이 되어야하는데 발생확률이 작은거에 큰비트수를 분배해줘야 (확률x비트수)가 최소가 될테니까요?