UTF-81 [Python] 인코딩 에러(UTF8, CP949) 해결 txt로 되어있는 데이터 파일을 불러오던 도중 종종 맞닥뜨리는 짜증나는 상황이 다시 한번 발견되었다. 더 이상 데이터 처리 과정에서 구글링에 애먹지 말자고 다짐하였기에, 해당 에러의 의미를 파헤치기로 했다. UTF-8? UTF-8은 전 세계적으로 가장 많이 사용되는 가변 길이 유니코드 인코딩이다. 유니코드? 가변길이? 천천히 알아보자 유니코드 : 전 세계의 모든 문자를 다루기 위해 설계된 표준 문자 전산 처리 방식. 많이 들어본 ASCII코드 또한 유니코드이다. 가변길이 유니코드 : 유니코드 한 문자를 나타내기 위해 UTF-8은 1byte ~ 4byte까지 사용 가능하며, 이를 가변 길이 인코딩 방식이라고 한다. 언어마다(국가마다) 인코딩 방법이 다르고, 한글을 위한 유니코드 또한 따로 존재한다. 그것이.. 2022. 12. 22. 이전 1 다음