[Tip] Julia 에서 한글등 encoding, decoding하기

Julia에서 웹페이지를 읽어 오는 경우 아직 웹 페이지가 EUC-KR 인코딩으로 되어 있는 경우가 있다.

이런 경우 decoding을 하지 않으면 에러가 발생하고 화면에 재대로 표시 되지 않는다.

이전 글의 예 처럼 한국거래소(KRX)에서 상장사 목록을 읽어 오는 경우 KRX에서 제공하는 html이 euc-kr로 인코딩 되어 있어

이를 decoding해야 화면에 재대로 표시 된다.

using HTTP
# 아래 패키지가 encoding/decoding을 한다.
using StringEncodings
res = HTTP.get("http://kind.krx.co.kr/corpgeneral/corpList.do?method=download");
# "euc-kr"로 인코딩 되어 있기 때문에 "euc-kr"로 디코딩 해야 julia 내부 string 포맷("utf-8")으로 바뀌어서
# 화면에 재대로 표시 된다.
htm = decode(res.body,"euc-kr");

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다