텍스트 파일 인코딩 UTF-8과 EUC-KR 차이로 인한 글자 깨짐 해결

텍스트 파일을 열었는데 ‘????’, ‘□□□’ 문자만 보이나요?

메모장에서 중요한 텍스트 파일을 열었는데 한글이 모두 물음표나 네모 박스로 표시되는 현상을 경험했다면, 이는 파일 인코딩 문제입니다. 특히 UTF-8로 저장된 파일을 EUC-KR 환경에서 열거나, 반대의 경우에서 발생하는 전형적인 증상입니다. 20년간 시스템을 운영하면서 가장 빈번하게 접수되는 문의 중 하나이며, 정확한 원인 파악 없이 무작정 인코딩을 바꾸다가 파일을 손상시키는 경우가 많습니다.

인코딩 충돌의 기술적 배경

한국어 텍스트 파일은 주로 두 가지 인코딩 방식으로 저장됩니다. EUC-KR(완성형 한글 코드)은 Windows 환경에서 오랫동안 사용되어 온 표준이며, UTF-8은 유니코드 기반의 국제 표준입니다. 문제는 동일한 한글 문자라도 두 인코딩 방식에 따라 전혀 다른 바이트 값으로 저장된다는 점으로, 이로 인해 파일 깨짐이나 호환성 문제가 발생할 수 있습니다. 이러한 차이와 변환 시 주의사항을 정확히 이해하려면 전체 안내 보기를 통해 인코딩 구조와 적용 방법을 함께 확인하는 것이 좋습니다.

예를 들어 ‘안녕’이라는 글자는 EUC-KR에서는 B0 C8 B3 E7로, UTF-8에서는 EC 95 88 EB 85 95로 저장됩니다. 잘못된 인코딩으로 해석하면 컴퓨터는 이 바이트들을 엉뚱한 문자나 깨진 기호로 표시할 수밖에 없습니다.

현재 파일 상태 정확한 진단법

해결책을 적용하기 전에 파일의 현재 인코딩을 정확히 파악해야 합니다. 잘못된 변환은 데이터 손실로 이어질 수 있습니다.

문제 파일을 메모장에서 열기
상단 메뉴에서 파일 → 다른 이름으로 저장 클릭
저장 대화상자 하단의 인코딩 드롭다운 메뉴 확인
현재 설정된 인코딩과 파일 내용 깨짐 여부를 비교 분석

중요: 파일 변환 작업 전에 반드시 원본 파일을 별도 폴더에 백업하십시오. 인코딩 변환 과정에서 데이터가 손실되면 복구가 불가능합니다.

깨짐 패턴별 원인 분석

글자 깨짐 현상은 몇 가지 특징적인 패턴을 보입니다. 정확한 패턴 식별이 올바른 해결 방향을 제시합니다.

각 패턴에 따라 적용해야 할 해결 방법이 달라집니다. 무작정 인코딩을 변경하기보다는 현재 상황을 정확히 파악한 후 단계적으로 접근하는 것이 안전합니다.

물음표(???) 연속 표시: UTF-8 파일을 EUC-KR로 잘못 해석한 경우
네모 박스(□□□) 표시: EUC-KR 파일을 UTF-8로 잘못 해석한 경우
한자나 특수문자 무작위 출력: 바이트 순서 또는 BOM(Byte Order Mark) 문제
일부 글자만 깨짐: 파일 내에 서로 다른 인코딩이 혼재된 경우

Windows 메모장의 인코딩 변환 기능 활용하기

Windows 10 이후 버전의 메모장에는 강력한 인코딩 자동 감지 기능이 내장되어 있습니다. 파일을 열 때 파일 → 열기에서 인코딩을 수동으로 지정할 수 있으며, 이 방법이 가장 확실한 해결책입니다.

메모장에서 Ctrl + O를 눌러 파일 열기 창을 띄웁니다
문제가 된 텍스트 파일을 선택한 후, 하단의 ‘인코딩’ 드롭다운 메뉴를 확인합니다
현재 ‘UTF-8’로 설정되어 있다면 ‘ANSI’로 변경 후 열기를 시도합니다
여전히 깨진다면 ‘UTF-16’ 또는 ‘UTF-16 BE’로 재시도합니다

주의사항: 인코딩을 잘못 지정하면 파일 내용이 완전히 손상될 수 있습니다. 원본 파일은 반드시 다른 폴더에 백업한 후 작업하십시오.

명령 프롬프트를 통한 일괄 인코딩 변환

여러 파일을 한 번에 처리해야 하는 상황이라면 PowerShell의 Get-Content 명령어를 활용하는 것이 효율적입니다. 이 방법은 대량의 텍스트 파일을 처리하는 서버 관리자들이 자주 사용하는 기법입니다.

Win + R을 누르고 powershell을 입력하여 PowerShell을 관리자 권한으로 실행합니다
파일이 저장된 디렉토리로 이동: cd "C:\파일경로"
인코딩 확인 명령어 실행: Get-Content -Path "파일명.txt" -Encoding UTF8
올바른 인코딩이 감지되면 다음 명령어로 변환: Get-Content -Path "원본파일.txt" -Encoding EUC-KR | Set-Content -Path "변환파일.txt" -Encoding UTF8

Visual Studio Code를 활용한 전문적 해결법

개발자가 아니더라도 VS Code는 텍스트 인코딩 문제 해결에 있어서 가장 강력한 도구 중 하나입니다. 우하단 상태바에서 현재 인코딩 방식을 실시간으로 확인하고 변경할 수 있어 직관적입니다.

VS Code에서 파일을 열면 우하단에 현재 인코딩 방식이 표시됨
해당 영역을 클릭하면 ‘인코딩으로 다시 열기’ 옵션 제공
EUC-KR, UTF-8, UTF-16 등 다양한 인코딩을 시각적으로 비교 가능
변환 후 Ctrl + S로 저장하면 새로운 인코딩으로 파일이 저장됨

근본 원인 차단을 위한 시스템 설정 최적화

동일한 문제가 반복 발생하는 것을 방지하려면 Windows 지역 설정을 점검해야 합니다. 특히 한국어 Windows에서 일본어나 중국어 텍스트를 다룰 때 이 문제가 빈번하게 발생합니다.

Win + I로 설정 창을 열고 ‘시간 및 언어’ 선택
‘지역’ 메뉴에서 ‘관리 언어 설정’ 클릭
‘관리’ 탭에서 ‘시스템 로캘 변경’ 버튼 클릭
‘Beta: 전 세계 언어 지원을 위해 Unicode UTF-8 사용’ 체크박스 활성화
시스템 재부팅 후 텍스트 파일 재확인

전문가 팁: 웹에서 다운로드한 텍스트 파일의 경우 브라우저 설정에서 기본 다운로드 인코딩을 UTF-8로 고정하면 90% 이상의 문제를 사전 차단할 수 있습니다. Chrome의 경우 ‘설정 → 고급 → 언어 → 언어’ 에서 한국어를 최상단으로 이동시키고 ‘웹페이지를 이 언어로 번역 제안’ 옵션을 활성화하십시오.

문제 해결 완료 후 검증 절차

인코딩 변환 작업이 완료되었다면 파일 무결성을 반드시 검증해야 합니다. 변환 과정에서 일부 특수문자나 이모티콘이 손실될 가능성이 있기 때문입니다. 원본 파일과 변환된 파일의 줄 수와 문자 수를 비교하여 데이터 손실 여부를 확인하십시오. 앞으로는 텍스트 파일 생성 시 처음부터 UTF-8 인코딩을 사용하는 습관을 들이면 이런 문제를 원천 차단할 수 있습니다.

Martin

Administrator

Visit Website View All Posts

Related Stories

골프 OB 아웃 오브 바운드 처리: 1벌타 및 재타격

배구 타임아웃 사용 횟수 규칙: 세트별 2회 제한

페이 서비스의 ‘선불 충전금’ 안전성 논란

You may have missed