| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
- 파이썬
- docker
- rnn
- 가상환경
- 머신러닝
- DeepLearning
- Anaconda
- 파이썬문법
- CNN
- AI
- vsC
- vision transformer
- objectdetection
- 딥러닝
- ubuntu
- LSTM
- torch.nn
- pytorch
- __call__
- ViT
- Torchvision
- torch.nn.Module
- python
- python 문법
- Visual Studio Code
- __init__
- tensorflow
- 가상환경구축
- wsl2
- pychram
- Today
- Total
목록분류 전체보기 (73)
인공지능을 좋아하는 곧미남
오늘은 python으로 프로그램을 구현할 때, 오류가 발생했을 경우! 예외 처리를 하기 위해서 try, except 조건을 걸어서 후처리가 가능한데요. 그것에 대한 기본적인 프로세스를 간단한 예제로 실험해보겠습니다. 아래와 같이 예제 코드가 있는데요.여기서, print(1/0)은 Exception : division by zero 오류를 출력합니다!그래서 가상으로 오류를 만들어서 처리 프로세스를 알려드리겠습니다.a = [1,2,3]try: for i in a: print(i) print(1/0) except Exception as e: print(f"Exception : {e}")else: print("else")finally: ..
Faster Whisper 모델을 활용하면서 브랜드 고유 명사와 같은 삼성, 엘지, 투싼 등 이런 단어들은 전사 정확도가 낮은 것을 볼 수 있었다. 그래서, 모델을 개선하기 위한 방법은 음성 데이터를 수집하여 파인 튜닝을 해야한다. 하지만 매번 이런 고유 명사를 위해서 파인 튜닝하는 것은 비용 효율적이지 않다. 그래서 고안된 기능이 Hotwords이다. 오늘은 Faster Whisper 모델의 Hotwords 기능에 대해서 알아보자! Faster Whisper 모델의 코드를 보면 hotwords라는 변수를 가지고 있다. 설명을 보면 모델에 어구에 대한 힌트를 제공한다고 되어 있다. hotwords: Hotwords/hint phrases to provide the m..
서론객체 탐지(object detection), 시맨틱 분할(semantic segmentation) 및 인스턴스 분할(instance segmentation)은 컴퓨터 비전 분야의 핵심 과제로, 위성 및 항공 영상 분석에서도 중요한 역할을 합니다. 객체 탐지는 이미지 내 개별 객체의 위치와 범주를 식별하고, 시맨틱 분할은 영상의 모든 픽셀을 미리 정의된 클래스로 할당하며 동일 객체 간 구분은 하지 않습니다. 인스턴스 분할은 이러한 두 작업을 결합하여 각 객체 인스턴스별로 픽셀 단위 마스크를 예측함으로써, 객체 탐지의 위치 식별과 시맨틱 분할의 픽셀 단위 분류를 동시에 만족합니다. 다중 작업은 모든 작업 또는 작업의 하위 집합이 주어지면 모든 작업 또는 일부 다른 작업에 포함된 지식을 사용하여 각 특..
진짜 어마어마한 삽질을 많이 했다!나의 문제는 이거였다.도커 컨테이너 run할때 -v로 dataset 공유 폴더를 연동했는데, 그게 작업 폴더 경로에 있었습니다. 근데 이 dataset 공유 폴더에 1000만개 이상의 wav데이터가 존재합니다. 그걸 pylance가 작업 폴더의 파일들을 읽어서 뭐 처리를 하는데, heap 메모리가 초과되어 oom 문제로 정상적으로 작동하지 않았던거죠.문제 파악 방법 아래 캡처본과 같이 VSC, Python 언어 서버에서 터미널-출력 내용을 보면, 아래와 같이 Error가 출력된다.Error 내용 : FATAL ERROR: Ineffective mark-compacts near heap limit Allocation failed - JavaScript heap out of..
오늘은 임베딩에 대해서 알아보겠습니다. 음성, 언어 모델이나 LLM을 개발할때, 임베딩 모델은 정말 중요한 역할을 합니다. 1. 단어 임베딩Word2Vec이나 GloVe와 같은 단어 임베딩 모델은 "사람", "인간" 같은 유사한 의미를 가진 단어들이 벡터 공간에서 가까이 위치하도록 학습합니다. 2. 텍스트 임베딩BERT와 같은 모델은 전체 문맥을 고려하여, 문장 간의 의미적 관계를 포착하는 데 중점을 둡니다.
https://arxiv.org/abs/2501.09223 Foundations of Large Language ModelsThis is a book about large language models. As indicated by the title, it primarily focuses on foundational concepts rather than comprehensive coverage of all cutting-edge technologies. The book is structured into four main chapters, each exploring a key aarxiv.org 해당 서적을 읽으면서 LLM의 기초에 대해서 이해하고 모델 학습 방법을 알아본다. 이 색깔은 제가 생각한 부분을 ..
https://www.acmicpc.net/problem/1032 [내가 구현한 내용] 결과 통과!if __name__ == "__main__": N = int(input()) a = [] for i in range(N): a.append(str(input())) if N == 1: print(a[-1]) else: str_length = len(a[0]) first_text = a[-1] second_text = a[-2] reference_text = [] # 첫번째, 두번째 TEXT 비교해서 reference txt 만들고 for i in range(str_l..
오늘은 sys.path, sys.modules에 대해 알아보고, python에서 소스코드가 실행되는 장소를 적절하게 설정하는 방법을 알아보겠습니다. 제가 겪은 경험으로는 python pip lib openwakeword 모듈을 install해서 /usr/local/lib/python3.10/dist-packages/openwakeword 이 경로에 있는 소스 파일들에 vsc가 접근해서 수정하게 되더라고요! 근데 저는 수정된 내용을 github에 바로 commit하기 위해서 local path인 /home/openWakeWord/openwakeword 에서 소스 파일들을 수정하려고 했습니다. 하지만, 처음에 import 할 당시 /usr/local/lib/python3.10/dist-packages/o..