[ChatGPT, Fine-Tuning] 데이터 셋 크기에 따른 Fine-Tuning 비용 추정

기준일 2023-11-09 적용모델 GPT-3.5-turbo 가격(price) $0.0080 per 1,000 tokens for training 가정(Assume) GPT 모델에서는 대략적으로 1 토큰이 평균 4바이트(약 4 문자) or 0.75 단어 Example 당 평균 500토큰(대략 375단어 또는 약 2,000자에 해당) A4 용지 한 페이지에 약 500단어 또는 약 2,000자가 들어간다고 가정 Dataset Size Number of Examples Tokens(Approx.) Words(Approx.) Characters(Approx.) Pages (Approx.) File […]

[ChatGPT, Fine-Tuning] 데이터 셋 크기에 따른 Fine-Tuning 비용 추정 Read More »

[ChatGPT,OpenAI] OpenAI API를 사용한 ChatGPT 프로그램 예제

유트브 Using OpenAI API on your Julia code 의 Pluto 버전으로 다시 작성 프롬프트 부분을 한글로 바꾸고 GPT의 출력값을 더 명확하게 하기 위해 프롬프트에 “설명은 하지 말고 국가 목록만 알려주세요.”를 추가 했습니다. 이렇게 해야 국가 코드 목록만 가져 오기 때문에 쉽게 취급 됩니다. 위의 추가적인 프롬프트가 없는 경우 아래와 같이 결과 값이 나와서 필요한 국가

[ChatGPT,OpenAI] OpenAI API를 사용한 ChatGPT 프로그램 예제 Read More »

[Medium, Trading] What they don’t teach you about time series and predictions..

What they don’t teach you about time series and predictions.. (시계열 및 예측에 대해 알려주지 않는 것들) 이전 직장에서 가장 도전적이었던 프로젝트 중 하나는 유럽의 BEV(배터리 전기 자동차) 시장 발전을 예측하는 것이었습니다. ML 분야의 대부분의 프로젝트와 마찬가지로, 이 프로젝트는 기술적 측면뿐만 아니라 도메인별 과제를 모두 안고 있었습니다. 제 경우에는 서로 관련이 있었습니다. 이 글의 주제인

[Medium, Trading] What they don’t teach you about time series and predictions.. Read More »

[Julia, Turing] Tutorial – 08 Multinormial Logistic Regression

베이즈 다항 로지스틱 회귀(Multinormial Logistic Regression)를 사용하는 방법과 이를 사용하여 Iris(붓꽃) 의 특성과 분류를 학습하고 신규 특성으로 부터 붓꽃을 분류하는 방법을 알아 봅니다. 키워드 베이즈 다항 로지스틱 회귀 프로세스

[Julia, Turing] Tutorial – 08 Multinormial Logistic Regression Read More »

[Julia, Pluto] Pluto 원격 실행, 보안 접속 URL 및 실행로그 저장, 파일 폴더변경

아직 까지 Pluto v0.19.27에서도 Jupyter notebook 처럼 원격접속시 password기반이나 다른방식의 로그인을 지원 하지 않고 있어 접속시 보안이슈가 있다 이를 해결하기 위한 현재 Pluto는 시작시 원격접속용 보안 접속URL을 생성하여 콘솔에 보여준다. 이 URL을 통해 접속 할 수 있다. Pluto를 백그라운드로 실행 하고 보안 URL을 파일로 저장하도록 redirect하는 경우도 Pluto에서 로그를 buffering하고 있어 즉시 console에 출력되지 않아

[Julia, Pluto] Pluto 원격 실행, 보안 접속 URL 및 실행로그 저장, 파일 폴더변경 Read More »

[Julia, Turing] MCMC와 VI(변분추론) 장단점 그리고 둘 중 트레이딩에 적합한것은 ?

ChatGPT4 답변 베이즈 추론에서 MCMC (Markov Chain Monte Carlo)와 변분 추론 (Variational Inference, VI)는 사후 분포를 추정하는 두 가지 주요 방법입니다. 각 방법의 특징 및 장단점을 다음과 같이 요약할 수 있습니다: MCMC (Markov Chain Monte Carlo): 장점: 단점: 변분 추론 (Variational Inference, VI): 장점: 단점: 결론적으로, MCMC와 VI는 각각의 장단점을 가지고 있으며, 특정 문제나 응용

[Julia, Turing] MCMC와 VI(변분추론) 장단점 그리고 둘 중 트레이딩에 적합한것은 ? Read More »

[Julia, Turing] Julia Turing package를 사용하여 사후분포를 온라인 업데이트 가능하게 할 수 있나?

ChatGPT4의 답변 Turing.jl은 Julia 언어에서 베이지안 통계 모델링을 위한 패키지입니다. 기본적으로 Turing.jl은 정적 데이터에 대한 사후 분포를 추정하는 데 사용됩니다. 그러나 온라인 업데이트, 즉 새로운 데이터가 도착할 때마다 사후 분포를 업데이트하는 것은 전통적인 MCMC 방법으로는 직접적으로 구현하기 어렵습니다. 온라인 베이지안 업데이트를 위해서는 다음과 같은 접근 방법을 고려할 수 있습니다: Turing.jl 자체는 기본적으로 온라인 업데이트 기능을

[Julia, Turing] Julia Turing package를 사용하여 사후분포를 온라인 업데이트 가능하게 할 수 있나? Read More »