Julia에서 웹페이지를 읽어 오는 경우 아직 웹 페이지가 EUC-KR 인코딩으로 되어 있는 경우가 있다.
이런 경우 decoding을 하지 않으면 에러가 발생하고 화면에 재대로 표시 되지 않는다.
이전 글의 예 처럼 한국거래소(KRX)에서 상장사 목록을 읽어 오는 경우 KRX에서 제공하는 html이 euc-kr로 인코딩 되어 있어
이를 decoding해야 화면에 재대로 표시 된다.
using HTTP
# 아래 패키지가 encoding/decoding을 한다.
using StringEncodings
res = HTTP.get("http://kind.krx.co.kr/corpgeneral/corpList.do?method=download");
# "euc-kr"로 인코딩 되어 있기 때문에 "euc-kr"로 디코딩 해야 julia 내부 string 포맷("utf-8")으로 바뀌어서
# 화면에 재대로 표시 된다.
htm = decode(res.body,"euc-kr");