ChatGPT 같은 AI를 로컬에서 하는 방법

딥시크(DeepSeek) 로컬 실행 방법

딥시크(DeepSeek) AI 모델을 로컬 PC에서 실행하는 대표적인 방법은 Ollama 또는 LM Studio와 같은 툴을 활용하는 것입니다. 아래에 각 방법별 설치 및 실행 절차, 요구 사양, 주요 특징을 정리합니다.

Ollama를 이용한 딥시크 로컬 실행

CPU 스레드 조정:

ollama run deepseek-r1:1.5b --num-threads=4

응답 토큰 제한:

ollama run deepseek-r1:1.5b --max-response-tokens=100

LM Studio를 이용한 딥시크 로컬 실행

LM Studio는 Windows, macOS, Linux에서 사용 가능하며, GUI 환경을 제공해 초보자도 쉽게 딥시크 모델을 다운로드 및 실행할 수 있습니다.
설치 후 좌측 검색창에서 deepseek을 검색, 원하는 모델을 다운로드 및 로드하여 바로 실행

딥시크를 로컬에서 실행하면, 보안과 자유도 면에서 매우 큰 이점을 누릴 수 있습니다.

qwen2:1.5b-instruct 모델로 설치 하시면 한글로 대답하는 AI를 보실수 있습니다.
ollama pull qwen2:1.5b-instruct
ollama run qwen2:1.5b-instruct

ollama pull hf.co/MLP-KTLim/llama-3-Korean-Bllossom-8B-gguf-Q4_K_M:Q4_K_M
ollama run hf.co/MLP-KTLim/llama-3-Korean-Bllossom-8B-gguf-Q4_K_M:Q4_K_M

Ollama로 LLM(예: Llama3, Qwen 등)을 설치하고, 웹브라우저에서 ChatGPT처럼 사용할 수 있는 환경을 만드는 대표적인 방법을 안내합니다.

가장 많이 쓰이는 방법은 Open WebUI(구 Ollama WebUI)입니다.
이 툴은 Ollama에 연결해 웹브라우저에서 챗봇처럼 사용할 수 있게 해줍니다.

Docker Desktop 설치
터미널(또는 명령 프롬프트)에서 아래 명령 실행:
- 호스트IP는 Ollama가 설치된 PC의 IP 주소(같은 PC면 localhost)
- Ollama가 이미 실행 중이어야 함
docker run -d -p 3000:8080 -e WEBUI_LANGUAGE=ko-KR -e OLLAMA_API_BASE_URL=http://호스트IP:11434 --name open-webui ghcr.io/open-webui/open-webui:main
브라우저에서 http://localhost:3000 접속
(다른 PC에서 접속하려면 http://Ollama서버IP:3000)

위 방법으로 Ollama, Open WebUI 2개만 설치하면 자신만 ChatGPT를 만들어서 사용할 수 있습니다.

728x90