애국보수 [823315] · MS 2018 · 쪽지

2018-10-07 21:54:23
조회수 2,636

오늘은 과외하는 입장에서 부호화 옵슛 목적론을 다시 읽어봄

게시글 주소: https://orbi.kr/00018682751

과제 : 왜 확률이 낮은 기호에 비트가 많은 부호를 할당하는지 이해해볼것


이거 오늘 발견하고 소름돋음


아... 앞부분이 이해되면 저절로 그냥 정리가된다는 것을 알고 소름..

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.

  • 직탐빌런 · 806106 · 18/10/07 21:55 · MS 2018

    확률이 높은 기호에 비트가 적은걸 할당해야 총사용하는 비트가 줄어드니까 맞나여

  • 직탐빌런 · 806106 · 18/10/07 21:57 · MS 2018

    맞을거임 배경지식상 암튼 그럼ㅎ

  • 애국보수 · 823315 · 18/10/07 21:57 · MS 2018

    ㄴㄴ 확률이 낮다는 정보량이 많으니 비트도 당연히 올라가야죠

  • 직탐빌런 · 806106 · 18/10/07 21:59 · MS 2018

    지문이 기억 안나서 그냥 생각해본건데 확률이 낮은 기호는 별로 안쓰이니까 비트가 많은걸 할당하고 확률이 높은 기호는 자주 쓰이니까 비트가 낮은걸 할당해서 총 사용하는 비트를 줄여서 효율적으로 만드는거 아닌가요?

  • 애국보수 · 823315 · 18/10/07 22:01 · MS 2018

    그럴수도 있죠 그게 엔트로피 부호화 아닌가요. 그리고 엔트로피의 개념은 mvue이라는 통계학 개념을 배워야 제대로 알수있음. mvue가 바로 엔트로피 부호화임.

  • 직탐빌런 · 806106 · 18/10/07 22:06 · MS 2018

    앆... 깊숙이 들어가면 모릅니다 흑
  • 애국보수 · 823315 · 18/10/07 22:08 · MS 2018

    맛만 보여주자면 그걸 알면 어떤 것에 대해 중요한 정보를 다 알 수 있다는 것? 그러니까 확률을 추정할 때 결국 중요한 것은 총 시도 횟수 대비 성공 횟수니까 몇번째에 성공했고 실패했고는 다 부수적인 정보니까 그걸 다 제거하고 비율만 계산하면 된다는 느낌?

  • 아무말대잔치 · 600885 · 18/10/07 21:56 · MS 2015

    평균맞추려고?

  • 트갤럼? · 812828 · 18/10/07 21:59 · MS 2018

    옵슛 현장에선 몰랐는데 ㄹㅇ 좋은지문임

  • 트갤럼? · 812828 · 18/10/07 21:59 · MS 2018

    문제도 어려웠으면 평균 좀 내려갔을거같음

  • 애국보수 · 823315 · 18/10/07 21:59 · MS 2018

    ㅇㅇ 문제의식을 통해서 엮어내면 그렇게 명쾌한게 없음

  • 반수싫어 · 804653 · 18/10/07 22:00 · MS 2018

    현장에선 많이 나오는 거엔 많이 나오니 용량 작게 하고 적게 나오는 거엔 용량 크게 해주면, 데이터 작아지니 이득 이렇게 생각하고 풀었는데../

  • 반수싫어 · 804653 · 18/10/07 22:02 · MS 2018

    4x3+ 5x1 이 5x3+4x1보다 용량 작으니! 라고 옆에 대충 쓰고 ㅋㅋㅋ

  • 샤로 · 765369 · 18/10/07 22:01 · MS 2017

    엔트로피랑 밀접한 관련이 있는 것으로 기억

  • 출기능수 · 655203 · 18/10/07 22:42 · MS 2016

    발생 확률이 낮은 기호는 정보량이 많은 기호인데, 기호의 정보량이 많은 만큼 부호로 변환할 때 많은 양의 비트 수가 필요할 것이고, 따라서 발생 확률이 낮은 기호에는 비트 수가 많은 부호를 할당한다....맞나요?ㅠ

    약간 억지일 것 같은 뇌피셜 첨언하자면 a란 기호가 발생 확률이 높으면 a가 적어도 딴 애보단 몇번쯤은 더 나오겟지라고 이미 예측해서 정보를 판단하는데 에너지를 아끼려고(?), 혹은 a가 나와봣자 심드렁(?), a가 나올거라는 것은 나도 알고 너도 알고 어차피 다 알만한거기에, 덜 놀라기 때문에(말이 점점 더 이상해지는군요...), 아무튼 딴거보단 좀 더 확실하기에, 즉 엔트로피(불확실성)를 줄이려고 정보량이 적도록 설정하고,

    b란 기호가 발생 확률이 낮다면 얘는 딴 애보다 적게 나오니 놓칠 수도 있다싶어서, 혹운 b가 나오면 오 레어템이 나오다니(???)라는 마음에, b를 놓치지 않기 위해(=예측 효율 향상+엔트로피 최소화 두 목적을 달성하기 위해) 정보량이 많도록 설정한 것이 아닐까 뇌피셜해봅니다... 통계에 대해 아는게 거의 없어서 정말 모르겟네요..

    맞는 판단인지 확인부탁드려요

  • 뜨거운남자 · 642571 · 18/10/07 22:47 · MS 2016

    엔트로피랑 최대한 가까이 맞추려면 최솟값이 되어야하는데 발생확률이 작은거에 큰비트수를 분배해줘야 (확률x비트수)가 최소가 될테니까요?