본문 바로가기

CloudBackend

검색하기
CloudBackend
프로필사진 CloudFullStack

  • 분류 전체보기 (6)
    • 인공지능 (1)
    • 클라우드 (4)
    • 회고, 돌아보기 (1)
Guestbook
Notice
Recent Posts
Recent Comments
Link
  • 포트폴리오
«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
Tags
  • ssh
  • CUDA
  • denied
  • 융기원
  • 오라클
  • 공모전
  • 인공지능
  • permission
  • 대회
  • 엔비디아
  • 경기창고
  • 도커
  • ai
  • Deeplearning
  • docker
  • 권한
  • ssh접속안됨
  • 2024경기창고
  • OutOfMemory
  • 클라우드
  • Torch
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록ai (1)

CloudBackend

Pytorch CUDA Out of Memory 해결하기

이번 공모전에 출품할 작품에는 요약, 키워드 추출 등 인공지능에 대한 기능이 많아 API 호출이 자주 발생합니다. 이를 위해 OpenAI 사에서 제공하는 ChatGPT API를 사용하게 되면 하루에 10$ 이상 크레딧을 사용하게 되었기에 LLM 서버를 직접 구축하고자 했습니다. 이 과정에서 LLaMA보다 OrionStarAI/Orion-14B-Chat 모델의 한국어 처리 성능이 뛰어나다는 조언을 받고 해당 모델을 채택하게 되었습니다. 그러나, 실행 과정에서 아래와 같은 오류를 마주하게 되었습니다. torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 300.00 MiB. GPU 0 has a total capacity of 22.09 GiB of ..

인공지능 2024. 10. 14. 16:55
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바