본문 바로가기
Data Science/NLP

Hypothesis Set

by 루크 Luke 2022. 3. 28.
반응형
  • 가설 집합은 무수히 많습니다. 머신러닝 접근 방법, 모델 구조, 하이퍼파라미터등 요소를 하나씩 변화할 때 마다 가설 하나가 세워지기 때문입니다.
  • 이번 강의 에서는 딥러닝에 한정 지어서 이야기 하겠습니다.
    • 네트워크 아키텍처가 정해지면, 하나의 가설 집합이 됩니다.
    • 각기 다른 가중치 매개변수 값에 따라서 가설 집합에 속한 모델이 달라집니다. 
  • 그렇다면 네트워크 아키텍처를 어떻게 정해야 할까요?
    • 명확한 정답은 없습니다.  
    • 다만 네트워크 아키텍처가 정해지면 그 뒤부터는 모든 것이 자동화 과정으로 넘어가는데, 어떻게 이것이 가능한지 알아봅시다.
  • 인공신경망은 무엇일까요?
    • 비순환 그래프(DAG) 라고 할 수 있습니다. 
    • 각 노드들은 이미 Tensorflow, Pytorch 등 패키지에서 잘 정의되어 있습니다. 여러분은 이 노드들을 어떻게 연결 시킬지에 집중하면 됩니다.
    • 장점:
      • 높은 수준의 추상화가 되어있으며, 비순환 그래프 안에 있는 노드들이 어떻게 구현되있고, 벡엔드에서 어떻게 쓰고 있는지 고려할 필요가 없습니다.
      • 객체 지향 프로그래밍 패러다임에 적합합니다.
      • 코드 재사용이 용이합니다.

 

 

본 내용은 부스트코스 조경현 교수의 딥러닝을 이용한 자연어 처리 수업 내용입니다.

반응형

'Data Science > NLP' 카테고리의 다른 글

Gradient-Based Optimization  (0) 2022.03.28
Backpropagation  (0) 2022.03.28
Optimization methods  (0) 2022.03.28
Probability & Loss Function  (0) 2022.03.28
Basic ML/DL Overview  (0) 2022.03.28

댓글