목록Data Science (3)
Data house

결과물 활용 기술 코드 설명 1. 라이브러리 및 버전 설정 import cv2,os import numpy as np from tensorflow.python.keras.utils import np_utils import imutils import pytesseract import tensorflow as tf from tensorflow import keras import matplotlib.pyplot as plt %matplotlib inline # pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' 1) 라이브러리 버전 numpy: 1.20.3 opencv-python: 4.8.0 tensor..

결과물 https://app-jx7bm2zg5gncr6xvtuxbsp.streamlit.app/ iris streamlit으로 데이터분석 / ML 결과물 웹으로 보여주기 app-jx7bm2zg5gncr6xvtuxbsp.streamlit.app streamlit 이란? python으로 데이터 분석을 위한 웹앱을 만들어주는 라이브러리 모델 배포, 그래프 시각화 등 웹어플리케이션을 배포할 수 있는 패키지 데이터/ML 앱을 만들기 위한 가장 빠른 방법 공식 사이트: https://docs.streamlit.io/library/get-started 장점 백엔드 개발 HTTP 요청 필요 없음 다양한 입력 위젯 (컴포넌트) 제공 간단히 배포 가능 빠르고 쉽게 배울 수 있음 단점 Django, Flask 등과 같은 웹..

준비 🏃🏻♀️ 전개: 데이터 EDA -> 데이터 정제(결측치/ 이상치) -> TF-IDF -> 모델링 -> 예측 사용할 데이터 : https://github.com/e9t/nsmc GitHub - e9t/nsmc: Naver sentiment movie corpus Naver sentiment movie corpus. Contribute to e9t/nsmc development by creating an account on GitHub. github.com 데이터 EDA 1. jupyter notebook에 다운한 데이터 로드 read_csv : 데이터가 저장된 주소를 기입 sep: 구분자를 기입( tab으로 나눠져 있으면 '\t') import warnings warnings.filterwarnin..