인공지능 기초 2022-2 텀프로젝트 정리

인공지능 기초 2022-2 Project Proposer

1팀. 차량파손 인식

1.주제소개

이미지 기반 차량 파손 인식 AI 모델 필요성 증가 데이터 - AI Hub Data Set -> 모집단의 데어터 대표 샘플링 json (군집화 샘플링 -> 골고르 샘플링)

2. 데이터 전처리

이진 마스크 생성 -> resize augmentation 여부로 파악

이미지 resizing

3. 분석과정

  • 플로우차트
  • 데이터 -> 클러스터링 -> 어그멘테이션 -> 마스크 -> 리사이즈 -> 스플릿 -> np.array -> 데이터 트랜스폼 -> 노멀라이제이션

  • 채택 모델

    U-Net

    • 다른 CNN보다 빠른 확인 가능
    • 이미지 규격에 상관없이 잘 작동 (리사이즈 편함)
    • 수축 경로 & 확장경로를 사용하여 실행
    • 컬러데이터 -> 그레이로 변경(무분별한 데이터였기에 학습 정확도 향상을 위해 사용)
    • 그레이(깊이가 1 -> 깊이 증가)
  • 분석

    CUDA

  • Nomalization -> local optima 해결

4.문제

Network Save & Recall

  • 코랩 환경에서 런타임 초과 문제 해결을 위해 데이터 저장해서 계속 실행

Network Train

  • 네트워크를 저장하고, 호출할 경로 설정

IoU Function 사용 -> 계속해서 수축하여 줄어드는 모습 -> 다른 데이터는 에폭이 늘어남에따라 퍼져있는 데이터가 더 중요부위에 모와지면서 모아지는 경향을 보임

-. 교집합과 합집합으로 나눠 학습하는 모델 (라벨에서 떨어지면 데이터가 너무 많이 벌어짐)

2팀. 손글씨 인식 모델

Flow chart

-> CNN, CV2(MNIST)

-> 전이 학습과 ResNet18 -> cosine similarity

Siamese Network (샴 네트워크)

  • 특정 클래스에 대한 사진을 대량으로 구할수 없을때 클래스 구분을 위해 고안된 네트워크

  • 추출된 벡터간의 거리로 유사한 이미지끼리 가까운 거리를 가지고, 서로 다른 이미지 간에는 먼 거리를 가지게 된다

  • 구성: 샴 네트워크 코드, 훈련 모델, 구현 코드

실제 적용

  • 싸인의 경우 다른 두사람의 싸인의 학습 유사도가 낮게 나왔다
  • but 서로 다른 사람이 쓴 손글씨간의 유사도도는 높게 나와 한계점을 가지고 있다.

3팀. 음성과 영상인식으로 감정 인식

과정, 개발환경

음성데이터

  • 한국어 음성 감정 데이터셋 사용 (2880개)
  • 중립, 행복, 슬픔, 분노
  • 성우가 직접 녹음

HuBERT 학습

  • 모델이 복잡
  • 특징이 있는 3개
    • Wav2Vec, MFCC, K-means

MFCC란?

  • 음성데이터를 특징 벡터화 하는 알고리즘
  • Mel-Scale
    • 달팽이관 (저주파음, 고주파음 인식)
    • 인간은 저주파에 더 민감하게 반응
    • 이것에 모티브

데이터 학습 시키기

  • 옵티마이저, 아담
  • 교차검증 결과 -> accuracy

이미지

  • 800gb
  • AI hub데이터

openCV

  • 얼굴만 크롭
  • 오류가 많아서 수작업으로 진행
  • 18000장 존재
  • 사이즈 9696으로 줄임 -> 교수님 말씀으로 6060으로 실행해도 괜찮

ResNet50

  • Conv2 -> batch_normalization -> max_pooling2d -> average_pooling -> flatten

파라미터값 수정

  • 배치가 적을때 노이즈가 작게 나오는 문제가 있어 학습이 잘 안될 때가 있다

한국

3팀. 오뭐먹

  • 사용자 정보 바탕 메뉴 추천

사용데이터

  • 사용자가 5가지 항목 입력

사이트

  • 파이썬, 스트림릿 모델 사용

사용데이터

  • 음식 선택 이유
  • 좋아하는 음식 종류
  • 과일 섭취량
  • 음식 소모 비용
  • 야채 섭취량

기존기능

  • 1개의 옵션만 가능
  • 입력과 동시에 결과 제공

바뀐점

  • UI 변경
  • 중복 선택을 가능하게 반영
  • 복수 선택 (사용자 옵션 다양화)
  • 결과 전송 버튼 -> 동시적 추천이라는 것을 보여주기 위해 사용
  • 추가추천 버튼 -> 다른 추천 결과 확인 가능

한계점

  • 위치기반 추천 기능을 구현할려고 했지만 크롤링과 API문제로 제대로 구현 실패
  • 데이터 수가 절대적으로 부적
  • 외국데이터를 사용했기에 국내 사용자에게 적합하지 않을 수 있음 -> 방대한 설문조사를 사용하게 된다면 해결할 수 있을 것으로 보인다

사이트소개

4팀. 고객 리뷰 유용성 진단 모델

문제 및 상황

  • B2C 기업들은 데이터를 기반으로 한 텍스트 분석을 시도
  • 광고성 리뷰들이 많음 -> 순수 고객의 리뷰를 찾는 과정이 어려움 -> So 맥북프로 리뷰를 찾았을때 유용한 데이터를 찾을 수 있으면 좋겠다고 생각

분석 순서

  1. 데이터 수집
  • 클리앙 게시글 크롤링 할 수 있는 코드 개발
  1. 데이터 라벨링
  • 유용하면 라벨 1, 유용안하면 라벨 0
  • 문장 토큰화를 통해 feature로 이용 -> Okt tokenizer이용하여 명사, 동사, 형용사 추출
  • 종속 변수 평가에 활용
  • 백터화

    • One-Hot Encoding
    • Bag of Words
  • TF-IDF적용 (사이킷런)
  1. 성능평가
  • 여러 모델 사용
  1. Logistic Regression 등등

4) 종합평가

  • 유용 vs 비유용 데이터 수 차이가 너무 크기에 학습이 좀 편향적으로 진행 되었음 -> 재현율&정밀도를 살펴보아야 함
  • 유용하다고 판단한것중에 실제로 유용한것이 얼마나 있는지 확인해야한다
  1. 활용성
  • 블로그에 사용
  1. 기대효과
  • 고객관와 제품 및 서비스 제공에 도움이 될것으로 기대

2023

우분투 가상환경 세팅

최대 1 분 소요

[우분투] 파이썬 가상환경 만들고 사용하기 - venv 사용하여 가상환경 생성

맨 위로 이동 ↑

2022

2023년 토이 프로젝트 주제

최대 1 분 소요

1. 영유아 행동인식을 통한 발달평가 XXX - https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=631

딥러닝과 텐서플로

1 분 소요

https://www.itworld.co.kr/insight/109825 [ITWorld - 머신러닝 라이브러리, 텐서플로우의 이해] https://tensorflow.blog/%EC%BC%80%EB%9D%BC%EC%8A%A4-%EB%94%A5%EB%9F%AC%EB%8B...

인경신경망

최대 1 분 소요

http://matrix.skku.ac.kr/math4ai-intro/W13/

[git] 삭제된 폴더, 파일 반영하기

최대 1 분 소요

분명히 로컬에서 삭제한 파일인데 원격에 반영되지 않는 경우가 있다. git status로 했을 때 삭제 됐다고 뜨는데 add를 해도 안먹고 commit을 해도 반영이 안되는 것이다…

맨 위로 이동 ↑