[OS] ch02 데이터

@NongDamGom · July 20, 2023 · 2 min read

0과 1로 숫자를 표현하는 방법

정보 단위

bit < byte < kB < MB < GB < TB

이진법

0과 1만으로 모든 숫자를 표현하는 방법!

이진법 사용시 숫자의 길이가 너무 길어지기 때문에 십육진법도 병행해서 사용한다.

0과 1로 문자를 표현하는 방법

문자 집합과 인코딩

문자 집합: 컴퓨터가 인식하고 표현할 수 있는 문자의 모음

문자 인코딩: 문자 집합에 속한 문자를 0과 1로 변환하는 과정

문자 디코딩: 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정

아스키 코드

문자 집합 중 한 종류로 알파벳, 숫자, 일부 특수 문자를 포함하고 있다.

각각 7비트로 표현되어서 2^7 = 128개의 문자로 표현할 수 있다.

EUC-KR

한글을 한 글자에 2바이트 크기로 인코딩할 수 있는 완성형 인코딩 방식

유니코드와 UTF-8

유니코드: 여러 나라의 문자를 표현할 수 있는 통일된 문자 집합으로 현대 문자를 표현할 때 가장 많이 사용되는 표준 문자 집합

유니코드 문자에 부여된 값을 인코딩된 값으로 사용하지 않고, 그 유니코드 값을 다양한 방법으로 인코딩하여서 사용하는데 그 인코딩 방법에 UTF-8이 있다.

@NongDamGom
개발하는 농담곰