Research Collector

Name: Research Collector
Author: Kit4Some
웹 리서치 자동화 파이프라인. "조사해", "수집해", "리서치", "찾아봐", "동향 파악", "경쟁사 분석", "뉴스 모아", "트렌드 분석" 요청 시 트리거. 다각도 검색 → 정보 수집 → 구조화 → 메모리 저장 → 보고서 생성을 자동 실행.
2 stars
0 votes
0 copies
0 views
Added 5/26/2026
researchgoapi
Works with

apimcp
Install via CLI
$openskills install Kit4Some/Oh-my-ClaudeClaw
Files
SKILL.md
---
name: research-collector
description: >
  웹 리서치 자동화 파이프라인. "조사해", "수집해", "리서치", "찾아봐",
  "동향 파악", "경쟁사 분석", "뉴스 모아", "트렌드 분석" 요청 시 트리거.
  다각도 검색 → 정보 수집 → 구조화 → 메모리 저장 → 보고서 생성을 자동 실행.
---

# Research Collector — 리서치 & 정보 수집 자동화 파이프라인

## 역할

사용자의 리서치 요청을 분석하여, 웹 검색과 페이지 수집을 통해 정보를 모으고,
구조화하여 메모리에 영구 저장한 뒤, 표준 보고서로 보고한다.
작업 시작 전 `memory_search`로 기존 관련 지식을 확인하고, 기존 정보와의 delta를 중심으로 수집한다.

## 사용 MCP 도구

| 도구 | 용도 |
|------|------|
| `memory_search` | 기존 관련 메모리 조회 (작업 시작 시 필수) |
| `memory_store` | 수집 결과 영구 저장 |
| `web_search` | 다각도 검색 쿼리 실행 |
| `web_fetch` | 유망 URL 상세 페이지 수집 |

## 리서치 파이프라인 5단계

### Step 1 — 요청 분석

사용자 요청에서 3가지를 판별한다:

| 항목 | 질문 | 판별 기준 |
|------|------|-----------|
| **주제** | 무엇에 대한 리서치인가? | 핵심 키워드 1~3개 추출 |
| **정보 유형** | 어떤 종류의 정보가 필요한가? | 아래 유형 분류표 참조 |
| **깊이** | 얼마나 깊이 조사할 것인가? | quick / standard / deep |

**정보 유형 분류**:

| 유형 | 트리거 표현 | 리서치 전략 |
|------|------------|-------------|
| 경쟁사 분석 | "경쟁사", "competitor", "비교" | → 경쟁사 분석 전략 |
| 기술 동향 | "동향", "trend", "기술 스택", "최신" | → 기술 동향 전략 |
| 인물 조사 | 이름+소속, "누구", "프로필" | → 인물 조사 전략 |
| 시장 조사 | "시장", "market", "규모", "성장률" | → 시장 조사 전략 |
| 일반 조사 | 위 어디에도 해당 안 됨 | → 기술 동향 전략 변형 |

**깊이 판정**:

| 깊이 | 쿼리 수 | web_fetch 수 | 소요 시간 |
|------|---------|-------------|-----------|
| quick | 3개 | 1~2개 | 1분 이내 |
| standard | 5개 | 3~5개 | 2~3분 |
| deep | 8개 | 5~10개 | 5분+ |

기본값: standard. 사용자가 "간단히", "빠르게" → quick. "자세히", "심층", "깊이" → deep.

### Step 2 — 검색 전략

깊이에 따라 3~8개의 검색 쿼리를 생성한다.

**쿼리 생성 규칙**:

1. **이중 언어**: 모든 주제에 대해 한국어 쿼리 + 영어 쿼리를 쌍으로 생성
2. **다각도**: 동일 주제를 다른 관점에서 검색 (뉴스, 기술, 비즈니스, 오피니언)
3. **날짜 키워드**: 최신성이 중요하면 "2026", "latest", "recent", "최근" 포함
4. **구체화**: 첫 검색 결과를 보고 후속 쿼리를 좁혀감

**쿼리 구조 템플릿**:

```
쿼리 1 (한국어 일반):  "{주제} {정보유형} 최신"
쿼리 2 (영어 일반):    "{topic} {info_type} 2026 latest"
쿼리 3 (한국어 구체):  "{주제} {세부키워드} {날짜범위}"
쿼리 4 (영어 구체):    "{topic} {specific_keyword} {date_range}"
쿼리 5+ (확장):       결과 기반 후속 쿼리 (deep 모드 시)
```

### Step 3 — 정보 수집

**실행 순서**:

1. `web_search`로 각 쿼리 실행
2. 검색 결과에서 유망 URL 선별 (제목·snippet 기반)
3. 선별된 URL을 `web_fetch`로 상세 수집
4. 각 소스에서 핵심 데이터 포인트 추출

**소스 우선순위** (높은 순):

| 순위 | 소스 유형 | 예시 |
|------|----------|------|
| 1 | 공식 발표·보도자료 | 기업 블로그, PR Newswire |
| 2 | 주요 테크 미디어 | TechCrunch, The Verge, ZDNet Korea |
| 3 | 전문 분석 리포트 | Gartner, CB Insights, Statista |
| 4 | 커뮤니티·포럼 | Hacker News, Reddit, GeekNews |
| 5 | 개인 블로그·SNS | Medium, Twitter/X, 개인 블로그 |

**수집 시 주의**:

- 동일 정보의 중복 수집 방지 (이미 추출한 데이터 포인트와 비교)
- 날짜 확인: 6개월 이상 오래된 정보는 "시점 주의" 표기
- 수치 데이터는 반드시 출처 URL 기록

### Step 4 — 구조화 & 메모리 저장

수집된 정보를 `memory_store`로 영구 저장한다.

**유형별 memory_store 파라미터 매핑**:

| 리서치 유형 | category | subcategory | tags 규칙 | importance |
|------------|----------|-------------|-----------|------------|
| 경쟁사 분석 | `projects` | 프로젝트명 (예: `sapiens`) | `["경쟁사", "분석", 경쟁사명...]` | 7 |
| 기술 동향 | `knowledge` | 기술 분야 (예: `ai`, `web3`) | `["동향", "기술", 키워드...]` | 6 |
| 인물 조사 | `people` | _(없음)_ | `["프로필", 소속, 역할...]` | 6 |
| 시장 조사 | `knowledge` | `business` | `["시장", "분석", 산업명...]` | 6 |
| 일반 조사 | `knowledge` | 주제 분야 | `["리서치", 키워드...]` | 5 |

**저장 content 구조**:

```markdown
## 조사 개요
- 주제: {topic}
- 조사일: {YYYY-MM-DD}
- 쿼리 수: {N}개, 소스 수: {M}개

## 핵심 발견
1. {발견 1} — [출처]({url})
2. {발견 2} — [출처]({url})

## 상세 내용
{구조화된 분석}

## 출처
- [{제목}]({url}) — {날짜}, {소스유형}
```

**저장 규칙**:

- 경쟁사 분석: 경쟁사별 개별 저장 + 비교 매트릭스 1건 = 총 N+1건
- 기술 동향: 주제당 1건으로 통합 저장
- 인물 조사: 인물당 1건
- 시장 조사: 시장당 1건

### Step 5 — 보고서 생성

모든 수집·저장이 완료된 후, 아래 표준 템플릿으로 보고한다:

```markdown
## 리서치 보고서: {주제}

**조사 일시**: {YYYY-MM-DD HH:MM}
**리서치 유형**: {경쟁사 분석 / 기술 동향 / 인물 조사 / 시장 조사}
**깊이**: {quick / standard / deep}
**검색 쿼리**: {N}개 | **수집 소스**: {M}개

---

### 핵심 발견

1. **{발견 제목}** — {한 줄 요약} ([출처]({url}))
2. **{발견 제목}** — {한 줄 요약} ([출처]({url}))
3. ...

### 상세 분석

{유형별 구조화된 분석 — 경쟁사면 비교 테이블, 기술이면 변화 타임라인 등}

### 소스 목록

| # | 제목 | URL | 날짜 | 신뢰도 |
|---|------|-----|------|--------|
| 1 | {제목} | {url} | {날짜} | {높음/중간/낮음} |

### 메모리 저장 내역

| 항목 | category | tags | importance |
|------|----------|------|------------|
| {제목} | {category} | {tags} | {importance} |

### 추가 조사 필요 항목

- {미해결 질문 또는 추가 조사가 필요한 영역}
```

## 리서치 유형별 상세 전략

### 1. 경쟁사 분석

```
단계:
1. memory_search(query: "경쟁사", category: "projects") → 기존 경쟁사 목록 확인
2. 경쟁사 목록이 없으면 → web_search("{프로젝트} competitor alternatives")로 식별
3. 각 경쟁사에 대해 (병렬 가능):
   a. web_search("{경쟁사명} funding news 2026")
   b. web_search("{경쟁사명} product update latest")
   c. web_fetch(공식 사이트/블로그)
4. 비교 매트릭스 생성:
   | 항목 | 자사 | 경쟁사A | 경쟁사B |
   |------|------|---------|---------|
   | 제품 | ... | ... | ... |
   | 펀딩 | ... | ... | ... |
   | 기술 스택 | ... | ... | ... |
   | 강점 | ... | ... | ... |
   | 약점 | ... | ... | ... |
5. memory_store(category:"projects", subcategory:"{프로젝트}", tags:["경쟁사","분석"], importance:7)
```

### 2. 기술 동향

```
단계:
1. memory_search(query: "{기술 키워드}", category: "knowledge") → 기존 지식 확인
2. 검색 쿼리 (한/영 쌍):
   a. "{기술} 최신 동향 2026" / "{technology} trend 2026 latest"
   b. "{기술} 신규 릴리즈" / "{technology} new release announcement"
   c. "{기술} 비교 분석" / "{technology} comparison benchmark"
3. 주요 변화점 추출 (기존 지식 대비 delta):
   - 새로운 버전/기능
   - 시장 채택률 변화
   - 주요 이벤트 (인수, 오픈소스화 등)
4. memory_store(category:"knowledge", subcategory:"{분야}", tags:["동향","기술",키워드], importance:6)
```

### 3. 인물 조사

```
단계:
1. memory_search(query: "{이름}", category: "people") → 기존 프로필 확인
2. 검색 쿼리:
   a. "{이름} {소속}" / "{name} {organization}"
   b. "{이름} LinkedIn" / "{name} conference speaker"
   c. "{이름} interview" / "{이름} 인터뷰"
3. 수집 항목:
   - 현재 소속·직책
   - 경력 히스토리
   - 전문 분야·관심사
   - 최근 발표·활동
   - SNS/연락처 (공개 정보만)
4. memory_store(category:"people", title:"{이름}", tags:["프로필",소속,역할], importance:6)
5. 관련 프로젝트 메모리가 있으면 memory_update로 링크 추가
```

### 4. 시장 조사

```
단계:
1. memory_search(query: "{시장}", category: "knowledge") → 기존 시장 데이터 확인
2. 검색 쿼리:
   a. "{시장} 시장 규모 2026" / "{market} market size 2026"
   b. "{시장} 성장률 전망" / "{market} growth forecast CAGR"
   c. "{시장} 주요 기업 점유율" / "{market} key players market share"
   d. "{시장} 규제 동향" / "{market} regulation policy"
3. 수집 항목:
   - TAM/SAM/SOM (가능한 경우)
   - CAGR 및 성장 전망
   - 주요 플레이어 및 점유율
   - 진입 장벽·규제 환경
   - 최근 M&A/투자 동향
4. memory_store(category:"knowledge", subcategory:"business", tags:["시장","분석",산업명], importance:6)
```

## 실행 원칙

1. **기존 지식 우선** — 수집 전 반드시 `memory_search`로 기존 데이터 확인. 중복 수집 방지.
2. **출처 필수** — 모든 수치·사실에 URL 출처 첨부. 출처 없는 정보는 "미확인" 표기.
3. **이중 언어** — 한국어+영어 쿼리를 병행하여 국내외 정보를 균형있게 수집.
4. **최신성 우선** — 동일 주제의 정보가 여러 건이면 최신 정보를 우선 채택.
5. **delta 중심** — 기존 메모리에 이미 있는 정보보다 새로운 변화에 집중.

## 참조 문서

- 유형별 상세 검색 전략·쿼리 예시: `references/research-strategies.md`
- 보고서 포맷팅 스크립트: `scripts/format-report.py`
Research Collector

Works with

Attribution

Comments (0)