Total220 [자연어 처리 입문 NLP] #10 BERT(Bidirectional Encoder Represnetations from Transformers) 모델 소개 Inflearn에서 NLP 강좌인 "예제로 배우는 딥러닝 자연어 처리 입문 NLP with TensorFlow - RNN부터 BERT까지" 강좌를 들으며 정리한 글입니다. 섹션3까지는 사전 준비 과정이라 별도로 정리하지 않았습니다.BERTBidirectional Encoder Representations from Transfomers2018년 공개된 논문(이 논문 이후로) NLP Task에서도 빅 모델의 시대를 연 모델전이 학습 (Transfer Learning)Transfer Learning(= Fine-Tuning)는 이미 학습된 NN 파라메터를 새로운 Task에 맞게 다시 미세 조정하는 것을 의미컴퓨터 비전 문제에서는 ImageNet 등의 데이터 셋에서 미리 Pre-Traning => 풀고자 하는 .. 2024. 8. 30. [자연어 처리 입문 NLP] #9 Transformer - 최신 NLP의 기술의 기반이 되는 핵심 모델을 학습해보자 Inflearn에서 NLP 강좌인 "예제로 배우는 딥러닝 자연어 처리 입문 NLP with TensorFlow - RNN부터 BERT까지" 강좌를 들으며 정리한 글입니다. 섹션3까지는 사전 준비 과정이라 별도로 정리하지 않았습니다.TransformerBERT 등 기본 모델이 됨ANN (1950s) => CNN / LSTM (1980s) => Transformer(2017)딥러닝 구조 중 하나seq2seq 모델 기반 + (RNN이 아닌) Attention 기법을 적용장점특징들의 시간적, 공간적 연관관계에 대한 선행을 가정하지 않음RNN처럼 순차적인 형태가 아닌 병렬적 계산 가능멀리 떨어진 정보들에 대한 연관관계를 학습시계열 처리에서도 도전적인 문제Attention Vector를 길게 잡아서 멀리 있는 정보.. 2024. 8. 30. [자연어 처리 입문 NLP] #8 기계번역(Neural Machine Translation) - 딥러닝을 이용해 번역을 수행해보자 Inflearn에서 NLP 강좌인 "예제로 배우는 딥러닝 자연어 처리 입문 NLP with TensorFlow - RNN부터 BERT까지" 강좌를 들으며 정리한 글입니다. 섹션3까지는 사전 준비 과정이라 별도로 정리하지 않았습니다.기계 번역(Machine Translation) 방법론 변화규칙 기반 기계번역 (Rule Based Machine Translation)규칙을 벗어난 번역은 대응이 어려움새로운 언어를 추가할 때마다 규칙을 새로 규정 필요통계 기반 기계번역 (Statistical Machine Translation)통계적인 특징을 기반규칙 기반에 비해 성능은 나으나 일반화 성능이 떨어지는 문제점이 있음신경망 기계번역 (Neural Machine Translation)딥러닝 이용예외 상황에서 안정.. 2024. 8. 30. [자연어 처리 입문 NLP] #7 임베딩(Embedding) - 단어를 의미있는 벡터로 변경해보자 Inflearn에서 NLP 강좌인 "예제로 배우는 딥러닝 자연어 처리 입문 NLP with TensorFlow - RNN부터 BERT까지" 강좌를 들으며 정리한 글입니다. 섹션3까지는 사전 준비 과정이라 별도로 정리하지 않았습니다.One-hot Encoding 문제점데이터 형태가 Sparse 하다 (1인 경우보다 0인 경우가 많다)유사한 의미를 가진 단어 간의 연관성도 표현할 수 없다. Embeding 개념Sparse 한 One-hot Encoding 의 데이터 표현을 Dense 한 표현형태로 변환하는 기법 Embeding Vector 적절한 값을 찾아야...초기값을 가져다 사용할 수도 있고학습 과정에서 찾아갈 수도 있음 (fine tuning)Embedding 장점차원 축속 효과 (Vector 계산으로.. 2024. 8. 30. 이전 1 2 3 4 5 ··· 55 다음