2009년 8월 11일 화요일

iconv 명령어 -텍스트 파일의 한글이 깨질때


아래 박스안의 내용은 다음의 블로그에서 가져왔다.
http://hi5143.egloos.com/2244807

우분투에서는 utf-8이고 윈도우에서는 euc-kr 이라서인지
받아온 텍스트파일 내용이 자주 외계어가 되어버린다.

euc-kr파일을 utf-8파일로
iconv -f euc-kr -t utf-8 src.txt > dst.txt


utf-8파일을 euc-kr파일로
iconv -f utf-8 -t euc-kr src.txt > dst.txt


=========================
그럼 명령어 iconv에 대해 간단히 알아보자. 다음은 우분투의 도움말을 거의 내맘대로 번역을 한 것이다. --;

iconv는 문자코드를 특정코드로 재인코딩해주는 프로그램이다. 옵션과 사용법은 아래와 같다.

--from-code, -f encoding
컨버팅할 원본파일의 인코딩문자셑을 지정한다.
--to-code, -t encoding
컨버팅될 파일의 인코딩문자셑을 지정한다. 지정하지 않으면 현재 사용자지정의 코드로 자동 지정된다. 나의 경우는 utf-8이 기본설정으로 된다.
--list, -l
알려진 문자셑코드의 리스트를 보여준다.
-c
잘못된 문자들을 컨버팅될 출력파일에서 생략한다.
--output, -o file
컨버팅되어서 출력될 파일의 이름을 지정한다. 파일지정을 안하고 이 옵션을 생략하면 그냥 스크린으로 출력한다.
--silent, -s
에러말고 경고는 무시한다.
--verbose
진행정보를 출력한다.
--help, -?
도움말을 보여준다.
--usage
짧은 사용법을 보여준다.
--version, -V
프로그램 버젼을 보여준다.


따라서 위의 예제
iconv -f euc-kr -t utf-8 src.txt > dst.txt 는
iconv -f euc-kr -t utf-8 src.txt -o dst.txt 와도같다.

댓글 없음:

댓글 쓰기