본문 바로가기

ML3

Zero-Shot Learning 이번에 Find-a에서 하게된 ESG-NLP Competition 관련 논문을 읽던 중 Zero-shot을 활용한 LLM을 보게 되었는데,,, Zero-shot을 너무 좀 대충 알고 있었나 싶었다. 한번 정리해보자 1. Zero-shot learning 딥러닝의 우수한 성능을 보일 수 있는 이유는 막대한 양의 데이터가 기반됨 그러나 현실에서는 수 많은 데이터 중 정답 레이블이 함께 존재하지 않는 데이터가 훨씬 많음 레이블을 지정하는데 드는 시간과 비용에 따른 제약 존재 경우에 따라 레이블을 지정하는 것은 전문가만이 수행 가능함 ex. 꽃 데이터 중 레이블이 없는 다양한 야생화 데이터도 다량으로 존재함. 해당 데이터를 레이블화하는데 제약이 심할 것 레이블이 존재하는 데이터가 없는 상황 속에서, 해당 카테고.. 2023. 12. 9.
[핸즈온 머신러닝 정리] 1장. 배치 학습과 온라인 학습 앞 포스팅에서 머신러닝을 지도 학습, 비지도 학습, 강화 학습으로 나누어 보았다. 이는 '학습하는 동안의 감독 형태나 정보량'을 기준으로 분류한 것이다. 한편, 머신러닝은 '입력 데이터의 스트림(stream)으로부터 점진적으로 학습할 수 있는가?'에 따라 학습 방법을 크게 3가지로 나뉜다. 배치 학습(Batch Learning) 온라인 학습(Online Learning) 배치 학습 배치 학습에서는 시스템이 점진적으로 학습할 수 없으며, 가용한 데이터를 모두 사용해 훈련시켜야 한다. 먼저 시스템을 훈련시키고 그런 다음 제품 시스템에 적용하면 더 이상의 학습 없이 실행되게 때문에 학습한 것을 단지 적용만 하게 된다. 일반적으로 이 방식은 시간과 자원을 많이 소모하므로 보통 오프라인에서 수행한다. 그래서 '오.. 2021. 6. 26.
[핸즈온 머신러닝 정리] 1장. 지도 학습과 비지도 학습, 강화 학습 머신러닝은 '학습하는 동안의 감독 형태나 정보량'에 따라 학습 방법을 크게 3가지로 나뉜다. 지도 학습(Supervised Learning) 비지도 학습(Unsupervised Learning) 강화 학습(Reinforcement learning) 이번 포스팅에서는 간단하게 전체적인 개념만 살펴본다. 앞으로의 포스팅에서 자세하게 다룰 것이다. 지도 학습 훈련 데이터(Training data)를 알고리즘에 주입하고, 원하는 답인 레이블(Label)을 도출할 수 있도록 하는 기계학습의 한 방법이다. 대표적인 지도 학습으로는 분류(Classification)와 회귀(Regression)가 있다. 분류(Classification)는 스팸 필터와 같이 많은 메일 샘플로 스팸인지 아닌지 훈련을 받은 후, 어떻게 새.. 2021. 6. 26.