Generative AI Claude 3 출시 – 첫인상 mahler83, 2024-03-052024-03-05 어제 밤새 Claude 3 모델이 공개되었다. 라인업은 작은 순서부터 Haiku, Sonnet, Opus. 시나 음악 용어들인데 무슨 theme인지는 잘 와닿지 않는다. https://www.anthropic.com/news/claude-3-family 발표된 벤치마크 결과를 보면 대략 다음과 같아보인다 벤치마크 수치 중 GPT-4는 과거 수치이고 GPT-4-Turbo 모델은 저기서도 계속 수치가 올라가고 있음. 예를 들어 GSM8K는 92.0%가 아니라 95.3%가 나옴 가격을 대강…
Large language model OpenAI DevDay 업데이트 내용 정리 – 2023.11 mahler83, 2023-11-07 GPT-4 turbo 신규 모델 GPT-3.5 turbo 업데이트 Seed 고정, log prob Assistants API Custom GPT builder Multimodal API Model customization 개인적인 총평
Large language model ChatGPT 유료 기능 정리(2023.10.14기준) mahler83, 2023-10-152023-10-23 한 달에 22달러를 내고 사용하는 유료 ChatGPT는 무료에 비해 어떤 차이가 있나요?이 질문을 거의 모든 강연마다 질문받고 있어서 정리를 한 번 할 필요성이 있다고 생각했다. 유료버전 차이점 GPT-4 vs GPT-3.5 Vision model (GPT-4V) Web browsing (검색기능) Advanced Data Analytics (데이터 분석기능) Plugin DALL-E 3 Voice conversations You are going to…
Large language model ChatGPT fine-tuning 기능 신설 mahler83, 2023-08-232023-08-23 GPT-3.5 Turbo의 fine tuning 기능이 생겼다.이전까지는 GPT-3까지만 가능해서 fine-tuning이 필요한 작업에 GPT-3를 사용하는 것을 봤는데 잘 된 것 같다. GPT-3.5 turbo fine-tuning 사용처 사실 위의 내용은 지금까지는 instruction을 잘 주거나 1-shot, few-shot으로 어느 정도 해결 가능한 문제이긴 했다. 하지만 fine-tuning을 해놓으면 instruction이나 exemplar가 필요 없어진다. 그러면 그만큼 prompt가 짧아지고 사용할…
Large language model ChatGPT API 업데이트 2023.06.13 mahler83, 2023-06-142023-07-19 ChatGPT API의 업데이트 소식: GPT-4, GPT-3.5 Turbo 모두 성능 향상 + Function calling기능 추가 (함수처럼 기능을 기술하고 출력형식을 정하면 JSON 결과를 출력함) GPT-3.5 Turbo 가격 25% 인하, text-emebedding-ada-002 75% 인하 GPT-3.5 Turbo 16k모델 출시 (기존 모델은 4k context window) 드는 생각: 엠베딩 가격이 저번에 1/10로 떨어지고 거기서 또 1/4로 떨어진건데,…
Parenting 다양한 주제의 원어민 영어 줌 클래스 플랫폼 Outschool mahler83, 2021-08-042021-08-09 학교 방학에다 학원가에서 코로나19 집단감염이 발생하는 바람에 학원까지 전부 쉬면서 아이들이 심심함에 몸부림치고 있어서 “영어로 재미있는 주제로 하는 온라인 수업이 없을까?”하고 알아보게 되었다. 그렇게 해서 Outschool을 찾아내게 되었다. 아내 말로는 Outschool 플랫폼이 “원어민 줌 클래스”라는 이름으로 맘카페에서 일부 언급되고 있다고. 여러 개인 선생님들이 강좌를 개설하고, 학생들이 자기가 듣고 싶은 수업을…
Web News 텔레그램 해킹 사태와 대처법 mahler83, 2016-08-042023-08-29 테러방지법 등등 때문에 사이버 망명의 선택지가 됐던 보안의 대명사 텔레그램이 이란에서 털렸다는 뉴스가 떴다. 그것도 1500만명 수준으로. 애초에 발송자 어플에서 암호화한 뒤 암호화된 형태로 보내고, 수신자 어플에서 해독하는 방식으로 작동하기 때문에 대규모로 털리기 어려울텐데 어찌된 영문일까? 국내메신저들은 서버에 일정 기간 내용을 보관하기 때문에 서버가 뚫리거나 공권력이 요구하면 대규모로 메세지 내용이…
게임 셧다운 제도가 헌법재판소에서 합헌 판결을 받다니 mahler83, 2014-04-252014-04-25 게임 셧다운 제도가 헌재에서 합헌 판결을 받았다. 아이들이 게임하는 게 문제가 되면 ‘안’ 하도록 만들어야지 ‘못’ 하게 하다니.. 마치 광역버스에 사람들이 ‘안’ 서서 가도록 하는 게 아니라 ‘못’ 서서 가도록 만드는 것과 같은 수준의 생각이다. 1) 이를 계기로 본인인증이 확대되면 웹상의 자율성을 침해할 수 있는 여지가 많아진다. 예를 들어 인터넷…
Graph and Adjacency Matrix 기초 mahler83, 2014-03-202023-07-19 여러 항목간의 1:1 대결 결과를 바탕으로 전체 순위를 산정하는 방법을 공부하다가 Graph와 Adjacency Matrix라는 개념을 처음 접하게 되었다. 간단하게 정리를 해보자면… 그림처럼 A->B, B->C 이런 Graph인 G1이 있다고 하자. 이를 Adjacency matrix A1으로 변환할 수 있다. 이렇게 만들어진 Adjacency matrix는 재미있는 성질을 가지게 되는데, 바로 n제곱을 하게 되면 n단계를…
AWS 활용 – EC2 Instance Region 변경 mahler83, 2014-03-082014-05-05 기존에 미국 서부 region을 사용하고 있는데, CloudPing이라는 웹툴을 이용해 확인해보니 일본 region이 훨씬 빠른 것을 확인할 수 있었다. (사실 처음 AWS를 쓰기 시작할 때 default로 지정된게 미국 서부라서 멋모르고 이용하고 있었다. ㅜㅜ) 구글링을 잠깐 해보고 다음과 같이 작업을 진행했다. 1. Snapshot 생성 – 지금 서버가 돌아가는 volume의 id를 확인한 후…