AI4PKM FAQ

AI4PKM FAQ

질문 인덱스

기본 개념

CLI와 에이전트

Gobi Desktop

Voice Mode

프롬프트와 워크플로우

클리핑과 인제스트

볼트 관리

모바일과 원격 접근

트러블슈팅

기본 개념

AI4PKM이 무엇인가요?

AI4PKM은 AI for Personal Knowledge Management의 약자로, 개인 지식관리(PKM)를 AI로 자동화하는 오픈소스 프로젝트입니다. Obsidian을 기반으로 하며, Claude Code와 연동하여 컨텐츠 처리, 요약, 정리 등을 자동화합니다.

"제가 필요한 걸 그냥 만들 수 있는 프레임을 만드는 것이 목표입니다."

핵심 비전: AI를 서버가 아닌 내 워크스페이스로 불러오기 - ChatGPT처럼 AI 서버에 접속하는 것이 아니라, AI를 로컬 환경으로 가져와 개인 정보와 결합

PKM(Personal Knowledge Management)이란?

PKM은 개인 지식 관리의 약자로, 개인이 수집, 정리, 활용하는 모든 정보와 지식을 체계적으로 관리하는 실천입니다.

AI4PKM에서의 PKM 원칙:

볼트(Vault)와 KB란?

AI4PKM 볼트 구조:

vault/
├── _Settings_/          # 설정 파일
│   ├── Prompts/         # AI 프롬프트
│   └── Templates/       # 마크다운 템플릿
├── AI/                  # AI 생성 콘텐츠
├── Ingest/              # 입력 콘텐츠
├── Journal/             # 일일 저널
└── Projects/            # 프로젝트 노트

Gobi Desktop과 Orchestrator의 차이는?

구분 Orchestrator Gobi Desktop
인터페이스 CLI GUI
설치 npm/pip 앱 다운로드
용도 고급 사용자, 자동화 일반 사용자
개발자 진영님 민성님

소스 코드가 공개되어 있나요?

개발팀은 몇 명인가요?

코어 개발자는 2명입니다:

생태계를 키우기 위해 오픈소스로 공개하고 커뮤니티 참여를 장려하고 있습니다.

CLI와 에이전트

어떤 CLI/에이전트를 지원하나요?

AI4PKM은 처음 설계부터 멀티 CLI를 지원합니다:

CLI 지원 상태 비고
Claude Code 완전 지원 Speech Conversation 필수
Gemini CLI 지원 EIC 등에 사용 가능
Codex CLI 지원 -

왜 여러 CLI를 지원하나요?

토큰 비용 분산과 용도별 최적화를 위해서입니다.

"많은 분들이 클로드 코드를 많이 쓰다 보면 부담일 수 있기 때문에 좀 분산할 수 있는 방법을 제공하려고 합니다."

역할 분담 예시:

워커별로 다른 CLI를 지정할 수 있나요?

네, orchestrator.yaml에서 워커별 executor를 설정할 수 있습니다.

agents:
  EIC:
    executor: gemini_cli
  GDR:
    executor: claude_code

Speech Conversation은 어떤 CLI가 필요한가요?

Claude Code만 지원됩니다. 음성 대화 기능은 Claude Code의 고급 기능을 활용하기 때문입니다.

Worker에서 Python/Bash 스크립트를 실행할 수 있나요?

네, 가능합니다.

방법 1: Worker 타입을 "Tool"로 설정

workers:
  my_script:
    type: tool
    script: Tools/my_script.py

방법 2: 프롬프트 안에서 스크립트 호출

## Main Process
1. Run `python Tools/process.py`
2. ...

API 비용은 얼마나 드나요?

사용량에 따라 다르지만, 가성비 전략 예시:

"가성비 전략은 하나씩 다 20불짜리 그냥 하는 거예요. 20불짜리 기본 모드, 프로 모드 그냥 다 쓰고요."

5만원 이하 예산이라면:

Gobi Desktop

Gobi Desktop을 어디서 다운로드하나요?

공식 다운로드 링크에서 받으실 수 있습니다:

어떤 버전을 사용해야 하나요?

버전 상태 권장
2.3 프로덕션 권장
3.0 Experimental (Dev 모드) 비권장

"3.0은 지금 민성님이 실험 중이신 거라서 현재 프로덕션은 2.3입니다."

기존 Obsidian 볼트에 적용할 수 있나요?

네, Gobi Desktop에서 기존 볼트를 열면 됩니다.

왼쪽 인디케이터(녹색/빨간색)가 뭔가요?

싱크 이슈가 있을 수 있으며, 실제 상태와 다르게 표시되면 버그 리포트를 올려주세요.

New Vault 템플릿은 뭔가요?

Gobi Desktop에서 "New Vault" 생성 시 기본 템플릿이 적용됩니다:

향후 계획: 다양한 템플릿 추가 예정 (학생용, 2차 전직용, 어린이용)

Voice Mode

Voice Mode의 Passive와 Active 차이는?

모드 설명 API 필요
Passive Mode AI가 듣기만 함. 녹음 → 자동 전사 → 히스토리 파일 생성 로컬만으로 가능
Active Mode AI와 양방향 대화. 음성 질문 → AI 음성 답변 OpenAI API 필요

"패시브 모드는 그냥 듣는 거예요. 들으면 그걸 볼트에 저장할 거잖아요. 저장한 걸 가지고 뭔가 유용한 걸 할 수 있다는 거죠."

Passive Mode만 쓰려면 API가 필요한가요?

아니요, Passive Mode는 로컬 Whisper만으로 사용 가능합니다. 다만 한글 인식 품질이 다소 떨어질 수 있습니다.

한글 음성 인식 품질은 어떤가요?

"패시브 모드에서는 완벽할 필요가 없다는 것이 진영님의 의견입니다 - 나중에 수정하면 되니까요."

Claude 창에 음성으로 입력하는 방법은?

Gobi Desktop의 Voice Mode가 아닌 Claude Code 입력창에 직접 음성으로 입력하고 싶다면 외부 딕테이션 앱을 사용합니다.

무료 옵션: Mac Whisper

유료 옵션: Super Whisper

시스템 딕테이션보다 Whisper 기반 앱이 한글 인식률이 더 높습니다.

토큰 분리 구조는 어떻게 되나요?

graph LR
    A[사용자 음성] --> B[STT: 11Labs/로컬 Whisper]
    B --> C[텍스트 녹취]
    C --> D[처리: Claude Code 토큰]
    D --> E[TTS: 11Labs]
    E --> F[음성 응답]

퍼즈(일시정지) 기능이 있나요?

별도 퍼즈 버튼은 없지만, 마이크를 끄면 퍼즈가 됩니다.

패시브 모드로 캔버스를 실시간 업데이트할 수 있나요?

네, 가능합니다. 패시브 모드를 켜고 클로드 코드에 "녹취록을 모니터링하면서 캔버스를 업데이트해줘"라고 요청하면 됩니다.

"혼자 AI로 브레인스토밍을 하고 있었어요. 패시브 모드를 켜놓으면 AI가 노트를 다 쌓잖아요. 제 생각을 다 아는 거예요. 그걸 가지고 클로드 코드한테 '이 생각을 바탕으로 캔버스를 만들어 줘'라고 하면 제 생각을 시각적으로 만들어줘요."

보이스가 왜 중요한가요?

뇌의 다른 부분이 활성화되어 더 창의적인 생각이 가능해집니다.

"보이스로 AI랑 대화할 때 채팅할 때랑 뇌의 다른 부분이 켜지는 느낌이 들어요. 훨씬 더 창의적인 생각을 많이 할 수 있게 됐고, 대역폭도 당연히 늘어났죠. AI를 기계처럼 대하는 게 아니라 동반자, 파트너처럼 대하기 시작했어요."

프롬프트와 워크플로우

주요 프롬프트는 무엇이 있나요?

프롬프트 약자 용도
Enrich Ingested Content EIC 캡처한 콘텐츠 정리/요약
Generate Daily Roundup GDR 일일 라운드업 생성
Daily Ingestion and Roundup DIR 일일 인제스트 + 라운드업
Passive Brainstorm Canvas PBC 패시브 모드 캔버스
Real-time Voice Assistant RVA 실시간 음성 어시스턴트
Topic Index Update TIU 토픽 인덱스 업데이트

프롬프트와 워크플로우의 차이는?

"개별 프롬프트들이 구성 요소이고, 이 구성 요소를 조합해서 돌리는 게 워크플로우예요. 다 자연어고 조합하는 것도 자연어니까, 자연어가 워크플로우 정의를 대체한 거죠."

orchestrator.yaml은 뭔가요?

에이전트 라우팅과 자동화 설정 파일입니다.

agents:
  EIC:
    input_path: Ingest/Clippings
    input_type: new_file
    output_path: AI/Articles
    executor: gemini_cli

  GDR:
    input_path:
      - AI/Articles
      - Journal
    input_type: daily_file
    output_path: AI/Roundup
    executor: claude_code

트리거 조건:

input_type 트리거 용도
new_file 파일 생성 시 클리핑 처리
daily_file 하루 단위 데일리 라운드업
updated_file 파일 수정 시 노트 업데이트
manual 수동 실행 애드혹 리서치

스킬과 프롬프트의 차이는?

"스킬의 장점은 컨텍스트 세이빙이죠. 매번 클로드 코드의 전체 설정을 로딩할 필요가 없으니까요."

스킬은 Claude Code 전용이고, 다른 AI에는 AGENTS.md를 활용합니다.

인덱싱은 어떻게 하나요?

두 가지 인덱싱을 활용합니다:

  1. 시간 기반 (에피소딕 메모리)

    • Daily/Weekly Roundup
    • 특정 기간의 정보 조회
  2. 토픽 기반 (시맨틱 인덱싱)

    • Topic Index
    • 매일 밤 AI가 토픽별로 경험/학습 내용 추가

"스마트 커넥션스 플러그인도 있는데 지금은 안 써요. 그거 안 써도 클로드 코드가 꽤 잘 찾거든요."

컴파운딩 효과란?

스킬과 프롬프트가 쌓이면 점점 덜 손대도 좋은 결과가 나오는 선순환입니다.

"AI를 더 많이 쓰면서 스킬도 더 쌓고, PKM에 모든 게 다 들어 있으니까 컨텍스트가 계속 늘어나요. 점점 덜 손대도 더 좋은 결과물을 낼 수 있는 선순환의 고리를 만들고 싶었는데, 지금 한 단계씩 다가가고 있어요."

PDF 논문 처리 Worker는 어떻게 만드나요?

PDF 파일을 자동으로 처리하는 Worker를 만들려면 Anthropic의 PDF Skill을 참고합니다.

구성 요소:

  1. Skill 파일: PDF 읽기/파싱 로직
  2. Worker 설정: orchestrator.yaml에 트리거 조건 정의
  3. 프롬프트: 논문 요약/분석 지시

참고 자료:

Worker를 만들면 Ingest/Papers/ 폴더에 PDF를 넣을 때마다 자동으로 요약이 생성됩니다.

클리핑과 인제스트

웹 클리핑은 어떻게 하나요?

Obsidian Web Clipper를 사용합니다.

  1. 브라우저에 Web Clipper 확장 설치
  2. 웹페이지에서 클리핑 버튼 클릭
  3. Ingest/Clippings/ 폴더에 저장
  4. EIC 워커가 자동으로 처리

유튜브 영상을 요약할 수 있나요?

두 가지 방법이 있습니다:

방법 1: Readwise 연동

방법 2: YouTube Transcript Skill

EIC 프롬프트는 무엇을 하나요?

Enrich Ingested Content - 캡처한 콘텐츠를 정리합니다:

  1. 문법 및 트랜스크립트 오류 수정
  2. 구조화된 헤딩 추가
  3. 공유용 요약 생성
  4. 관련 토픽 링크 추가

어떤 인제스트 소스를 지원하나요?

소스 방법 폴더
웹페이지 Web Clipper Ingest/Clippings
유튜브 Readwise/Skill Ingest/Clippings
녹음/대화 Limitless/Omi Ingest/Limitless
사진 자동 가져오기 Ingest/Photolog
논문 Paper Pile Ingest/Papers

24시간 녹음은 어떻게 하나요?

Limitless 또는 Omi를 사용합니다.

"올해 중반부터 리밋리스 핀을 차고 있어서 대화가 다 캡처됩니다. 대부분 쓸데없는 내용이지만요."

주의: Limitless는 미국에서만 사용 가능, 서비스 종료 예정. Omi는 한국에서 사용 가능.

트랜스크립션 품질이 안 좋아도 괜찮나요?

네, 원본 데이터의 품질은 크게 중요하지 않습니다.

"완벽하게 정리하려 하지 말고 일단 쌓아라. AI가 나중에 정리해준다."

"핵심 문장 몇 개면 되는 건데, 이 정도 레벨의 요약은 AI가 노이지한 트랜스크립트로 충분히 할 수 있어요."

볼트 관리

멀티 볼트를 어떻게 관리하나요?

VAULTS.md 파일을 활용합니다.

설정 방법:

  1. main-vault에 VAULTS.md 파일 생성
  2. 사용하는 모든 볼트 경로 등록
  3. AGENTS.md에 "VAULTS.md를 참조하라" 명시
# VAULTS.md

## 볼트 목록
- OVM: /Users/me/Vaults/OVM (메인)
- OV2024: /Users/me/Vaults/OV2024 (아카이브)
- AI4PKM Team: /Users/me/Vaults/AI4PKM
- CV2601: /Users/me/Vaults/CV2601 (커뮤니티)

"저는 main-vault에 VAULTS.md를 만들어서 사용하는 모든 볼트를 등록해 놨어요."

참조 자료:

멀티 볼트 검색은 어떻게 하나요?

자연어로 요청합니다:

아직 수동으로 지정이 필요하며, 자동화 개선 예정입니다.

커뮤니티 볼트와 개인 볼트를 어떻게 연동하나요?

커뮤니티 프롬프트 3종을 활용합니다:

프롬프트 방향 용도
CPU 개인→커뮤니티 공유할 업데이트 푸시
Pull 커뮤니티→개인 최신 업데이트 가져오기
Community Question 양방향 커뮤니티에 질문하기

클로드 코드로 볼트 검색이 편해지나요?

네, 클로드 코드를 사용하면 볼트 관리가 훨씬 편해집니다.

"볼트 관리가 어려울 거라고 생각했는데, 클로드 코드를 사용하니까 검색이 편해요. OVM에서 검색하면 볼트 리스트를 다 갖고 있기 때문에, 기본 볼트에서 찾거나 '익스텐드 서치 해달라'고 하면 다른 볼트까지 뒤지는 거죠."

모바일과 원격 접근

모바일에서 AI4PKM을 사용할 수 있나요?

직접 앱은 아직 없지만, VPN 설정을 통해 원격으로 접근할 수 있습니다.

"모바일은 로드맵에만 있습니다."

현재 가능한 방법:

원격으로 집 컴퓨터에 접근하려면?

로컬 VPN을 설정합니다.

방법:

  1. 집 컴퓨터에 VPN 서버 설정
  2. 모바일에서 VPN 연결
  3. 터미널 앱으로 집 컴퓨터 SSH 접속
  4. Claude Code 명령 실행

"로컬 VPN으로 설정하면 그 장비에서만 돌아가니까 보안도 괜찮아요."

아이패드에서 집 맥스튜디오를 제어할 수 있나요?

네, 가능합니다.

구성 예시:

  1. 집 맥스튜디오에 Gobi Desktop 실행
  2. 아이패드에서 SSH 접속
  3. 음성 입력은 아이패드에서
  4. 처리는 맥스튜디오에서

"집에 있는 맥스튜디오에다가 고비를 켜 놓고 아이패드로 걔를 컨트롤해서 거기다가 보이스 인풋을 넣는 것들을 해 보려고 하거든요."

모바일 앱 출시 계획이 있나요?

로드맵에 있지만, 현재 개발자가 2명이라 우선순위가 낮습니다.

트러블슈팅

오케스트레이터가 실행되지 않아요

확인 사항:

  1. Gobi Desktop에서 녹색 인디케이터 확인
  2. 앱을 껐다 다시 켜보기
  3. _Settings_/Logs/ 폴더에서 에러 로그 확인

워커 스케줄링이 작동하지 않아요

확인 사항:

  1. 오케스트레이터 실행 확인
  2. 로그 확인: _Settings_/Logs/ 폴더
  3. 프롬프트 경로: 아웃풋 파일 경로가 하드코딩되어 있으면 제거
  4. 트리거 조건: input_path와 실제 파일 위치 일치 여부

Windows에서 Obsidian 버튼이 안 눌려요

알려진 이슈입니다.

패시브 모드에서 업데이트가 안 돼요

확인 사항:

  1. fswatch 설치 확인 (Windows)
  2. 클로드 vs 고비: 어느 쪽 문제인지 파악 필요
  3. 로그 확인: 에러 메시지 확인

"모든 분들에게 다 된다고 보장할 수 있는 단계는 아직 아닙니다."

에러 리포트는 어떻게 하나요?

디스코드에 다음 정보와 함께 공유:

  1. 에러 발생 상황 설명
  2. 사용 환경 (OS, Gobi 버전)
  3. 에러 로그 스크린샷/텍스트
  4. 재현 방법

유용한 디버깅 팁:

  1. 로그 확인: _Settings_/Logs/ 폴더
  2. 앱 재시작: 많은 문제가 재시작으로 해결
  3. 최신 버전 확인: 2.3 프로덕션 버전 사용
  4. 경로 확인: 한글/공백/특수문자 문제

참조