CS/컴퓨터구조

[컴퓨터 구조] 0과 1로 데이터를 표현하는 방법

연듀 2022. 9. 6. 12:50

 

 

1. 0과 1로 숫자를 표현하는 방법

 

 

컴퓨터는 0또는 1밖에 이해하지 못한다.

0과 1을 나타내는 가장 작은 정보 단위는 비트이다. 

n비트는 2^n가지 정보를 표현할 수 있다.

 

 

모든 프로그램은 수백만개 이상의 비트로 이루어져있고, 이를 편리하게 표현하기 위해 더 큰 단위를 사용한다.

 

1byte = 8bit

1KB = 1000byte

1MB = 1000KB

1GB = 1000MB

1TB = 1000GB

 

 

이진법 : 0과 1만으로 모든 숫자를 표현하는 방식. 1을 넘어가는 시점에 자리 올림을 한다. 음수는 2의 보수로 표현한다.

십육진법: 15를 넘어가는 시점에 자리 올림하여 수를 표현한다. 

 

 

 

 

2. 0과 1로 문자를 표현하는 방법

 

문자 집합: 컴퓨터가 인식하고 표현할 수 있는 문자의 모음

문자 인코딩: 문자집합의 문자들을 컴퓨터가 이해할 수 있는 0과 1로 변환하는 과정

문자 디코딩: 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정

 

 

 

아스키 코드:

아스키는 영어 알파벳과 아라비아 숫자, 일부 특수 문자를 포함하는 문자 집합이다.

아스키 문자들은 각각 7비트로 표현되어 총 2^7=128개의 문자를 표현할 수 있다.

아스키 문자의 대응된 고유의 수를 아스키 코드라고 한다.

=>아스키 문자 집합에 0부터 127까지의 수가 할당되어 아스키 코드로 인코딩 된다.

한글이나 아스키 문자 집합 외의 문자는 표현할 수 없다. 

 

EUC-KR : 한글을 2바이트 크기로 인코딩할 수 있는 완성형 인코딩 방식

모든 한글 조합을 표현할 수는 없다. 

 

유니코드: 여러 나라의 문자들을 광범위하게 표현할 수 있는 통일된 문자 집합.

현대 문자를 표현할 때 가장 많이 사용되는 표준 문자 집합이다. 

UTF-8, UTF-16, UTF-32는 유니코드 문자의 인코딩 방식