웹 리서치 자동화 파이프라인. "조사해", "수집해", "리서치", "찾아봐", "동향 파악", "경쟁사 분석", "뉴스 모아", "트렌드 분석" 요청 시 트리거. 다각도 검색 → 정보 수집 → 구조화 → 메모리 저장 → 보고서 생성을 자동 실행.
Install via CLI
openskills install Kit4Some/Oh-my-ClaudeClaw---
name: research-collector
description: >
웹 리서치 자동화 파이프라인. "조사해", "수집해", "리서치", "찾아봐",
"동향 파악", "경쟁사 분석", "뉴스 모아", "트렌드 분석" 요청 시 트리거.
다각도 검색 → 정보 수집 → 구조화 → 메모리 저장 → 보고서 생성을 자동 실행.
---
# Research Collector — 리서치 & 정보 수집 자동화 파이프라인
## 역할
사용자의 리서치 요청을 분석하여, 웹 검색과 페이지 수집을 통해 정보를 모으고,
구조화하여 메모리에 영구 저장한 뒤, 표준 보고서로 보고한다.
작업 시작 전 `memory_search`로 기존 관련 지식을 확인하고, 기존 정보와의 delta를 중심으로 수집한다.
## 사용 MCP 도구
| 도구 | 용도 |
|------|------|
| `memory_search` | 기존 관련 메모리 조회 (작업 시작 시 필수) |
| `memory_store` | 수집 결과 영구 저장 |
| `web_search` | 다각도 검색 쿼리 실행 |
| `web_fetch` | 유망 URL 상세 페이지 수집 |
## 리서치 파이프라인 5단계
### Step 1 — 요청 분석
사용자 요청에서 3가지를 판별한다:
| 항목 | 질문 | 판별 기준 |
|------|------|-----------|
| **주제** | 무엇에 대한 리서치인가? | 핵심 키워드 1~3개 추출 |
| **정보 유형** | 어떤 종류의 정보가 필요한가? | 아래 유형 분류표 참조 |
| **깊이** | 얼마나 깊이 조사할 것인가? | quick / standard / deep |
**정보 유형 분류**:
| 유형 | 트리거 표현 | 리서치 전략 |
|------|------------|-------------|
| 경쟁사 분석 | "경쟁사", "competitor", "비교" | → 경쟁사 분석 전략 |
| 기술 동향 | "동향", "trend", "기술 스택", "최신" | → 기술 동향 전략 |
| 인물 조사 | 이름+소속, "누구", "프로필" | → 인물 조사 전략 |
| 시장 조사 | "시장", "market", "규모", "성장률" | → 시장 조사 전략 |
| 일반 조사 | 위 어디에도 해당 안 됨 | → 기술 동향 전략 변형 |
**깊이 판정**:
| 깊이 | 쿼리 수 | web_fetch 수 | 소요 시간 |
|------|---------|-------------|-----------|
| quick | 3개 | 1~2개 | 1분 이내 |
| standard | 5개 | 3~5개 | 2~3분 |
| deep | 8개 | 5~10개 | 5분+ |
기본값: standard. 사용자가 "간단히", "빠르게" → quick. "자세히", "심층", "깊이" → deep.
### Step 2 — 검색 전략
깊이에 따라 3~8개의 검색 쿼리를 생성한다.
**쿼리 생성 규칙**:
1. **이중 언어**: 모든 주제에 대해 한국어 쿼리 + 영어 쿼리를 쌍으로 생성
2. **다각도**: 동일 주제를 다른 관점에서 검색 (뉴스, 기술, 비즈니스, 오피니언)
3. **날짜 키워드**: 최신성이 중요하면 "2026", "latest", "recent", "최근" 포함
4. **구체화**: 첫 검색 결과를 보고 후속 쿼리를 좁혀감
**쿼리 구조 템플릿**:
```
쿼리 1 (한국어 일반): "{주제} {정보유형} 최신"
쿼리 2 (영어 일반): "{topic} {info_type} 2026 latest"
쿼리 3 (한국어 구체): "{주제} {세부키워드} {날짜범위}"
쿼리 4 (영어 구체): "{topic} {specific_keyword} {date_range}"
쿼리 5+ (확장): 결과 기반 후속 쿼리 (deep 모드 시)
```
### Step 3 — 정보 수집
**실행 순서**:
1. `web_search`로 각 쿼리 실행
2. 검색 결과에서 유망 URL 선별 (제목·snippet 기반)
3. 선별된 URL을 `web_fetch`로 상세 수집
4. 각 소스에서 핵심 데이터 포인트 추출
**소스 우선순위** (높은 순):
| 순위 | 소스 유형 | 예시 |
|------|----------|------|
| 1 | 공식 발표·보도자료 | 기업 블로그, PR Newswire |
| 2 | 주요 테크 미디어 | TechCrunch, The Verge, ZDNet Korea |
| 3 | 전문 분석 리포트 | Gartner, CB Insights, Statista |
| 4 | 커뮤니티·포럼 | Hacker News, Reddit, GeekNews |
| 5 | 개인 블로그·SNS | Medium, Twitter/X, 개인 블로그 |
**수집 시 주의**:
- 동일 정보의 중복 수집 방지 (이미 추출한 데이터 포인트와 비교)
- 날짜 확인: 6개월 이상 오래된 정보는 "시점 주의" 표기
- 수치 데이터는 반드시 출처 URL 기록
### Step 4 — 구조화 & 메모리 저장
수집된 정보를 `memory_store`로 영구 저장한다.
**유형별 memory_store 파라미터 매핑**:
| 리서치 유형 | category | subcategory | tags 규칙 | importance |
|------------|----------|-------------|-----------|------------|
| 경쟁사 분석 | `projects` | 프로젝트명 (예: `sapiens`) | `["경쟁사", "분석", 경쟁사명...]` | 7 |
| 기술 동향 | `knowledge` | 기술 분야 (예: `ai`, `web3`) | `["동향", "기술", 키워드...]` | 6 |
| 인물 조사 | `people` | _(없음)_ | `["프로필", 소속, 역할...]` | 6 |
| 시장 조사 | `knowledge` | `business` | `["시장", "분석", 산업명...]` | 6 |
| 일반 조사 | `knowledge` | 주제 분야 | `["리서치", 키워드...]` | 5 |
**저장 content 구조**:
```markdown
## 조사 개요
- 주제: {topic}
- 조사일: {YYYY-MM-DD}
- 쿼리 수: {N}개, 소스 수: {M}개
## 핵심 발견
1. {발견 1} — [출처]({url})
2. {발견 2} — [출처]({url})
## 상세 내용
{구조화된 분석}
## 출처
- [{제목}]({url}) — {날짜}, {소스유형}
```
**저장 규칙**:
- 경쟁사 분석: 경쟁사별 개별 저장 + 비교 매트릭스 1건 = 총 N+1건
- 기술 동향: 주제당 1건으로 통합 저장
- 인물 조사: 인물당 1건
- 시장 조사: 시장당 1건
### Step 5 — 보고서 생성
모든 수집·저장이 완료된 후, 아래 표준 템플릿으로 보고한다:
```markdown
## 리서치 보고서: {주제}
**조사 일시**: {YYYY-MM-DD HH:MM}
**리서치 유형**: {경쟁사 분석 / 기술 동향 / 인물 조사 / 시장 조사}
**깊이**: {quick / standard / deep}
**검색 쿼리**: {N}개 | **수집 소스**: {M}개
---
### 핵심 발견
1. **{발견 제목}** — {한 줄 요약} ([출처]({url}))
2. **{발견 제목}** — {한 줄 요약} ([출처]({url}))
3. ...
### 상세 분석
{유형별 구조화된 분석 — 경쟁사면 비교 테이블, 기술이면 변화 타임라인 등}
### 소스 목록
| # | 제목 | URL | 날짜 | 신뢰도 |
|---|------|-----|------|--------|
| 1 | {제목} | {url} | {날짜} | {높음/중간/낮음} |
### 메모리 저장 내역
| 항목 | category | tags | importance |
|------|----------|------|------------|
| {제목} | {category} | {tags} | {importance} |
### 추가 조사 필요 항목
- {미해결 질문 또는 추가 조사가 필요한 영역}
```
## 리서치 유형별 상세 전략
### 1. 경쟁사 분석
```
단계:
1. memory_search(query: "경쟁사", category: "projects") → 기존 경쟁사 목록 확인
2. 경쟁사 목록이 없으면 → web_search("{프로젝트} competitor alternatives")로 식별
3. 각 경쟁사에 대해 (병렬 가능):
a. web_search("{경쟁사명} funding news 2026")
b. web_search("{경쟁사명} product update latest")
c. web_fetch(공식 사이트/블로그)
4. 비교 매트릭스 생성:
| 항목 | 자사 | 경쟁사A | 경쟁사B |
|------|------|---------|---------|
| 제품 | ... | ... | ... |
| 펀딩 | ... | ... | ... |
| 기술 스택 | ... | ... | ... |
| 강점 | ... | ... | ... |
| 약점 | ... | ... | ... |
5. memory_store(category:"projects", subcategory:"{프로젝트}", tags:["경쟁사","분석"], importance:7)
```
### 2. 기술 동향
```
단계:
1. memory_search(query: "{기술 키워드}", category: "knowledge") → 기존 지식 확인
2. 검색 쿼리 (한/영 쌍):
a. "{기술} 최신 동향 2026" / "{technology} trend 2026 latest"
b. "{기술} 신규 릴리즈" / "{technology} new release announcement"
c. "{기술} 비교 분석" / "{technology} comparison benchmark"
3. 주요 변화점 추출 (기존 지식 대비 delta):
- 새로운 버전/기능
- 시장 채택률 변화
- 주요 이벤트 (인수, 오픈소스화 등)
4. memory_store(category:"knowledge", subcategory:"{분야}", tags:["동향","기술",키워드], importance:6)
```
### 3. 인물 조사
```
단계:
1. memory_search(query: "{이름}", category: "people") → 기존 프로필 확인
2. 검색 쿼리:
a. "{이름} {소속}" / "{name} {organization}"
b. "{이름} LinkedIn" / "{name} conference speaker"
c. "{이름} interview" / "{이름} 인터뷰"
3. 수집 항목:
- 현재 소속·직책
- 경력 히스토리
- 전문 분야·관심사
- 최근 발표·활동
- SNS/연락처 (공개 정보만)
4. memory_store(category:"people", title:"{이름}", tags:["프로필",소속,역할], importance:6)
5. 관련 프로젝트 메모리가 있으면 memory_update로 링크 추가
```
### 4. 시장 조사
```
단계:
1. memory_search(query: "{시장}", category: "knowledge") → 기존 시장 데이터 확인
2. 검색 쿼리:
a. "{시장} 시장 규모 2026" / "{market} market size 2026"
b. "{시장} 성장률 전망" / "{market} growth forecast CAGR"
c. "{시장} 주요 기업 점유율" / "{market} key players market share"
d. "{시장} 규제 동향" / "{market} regulation policy"
3. 수집 항목:
- TAM/SAM/SOM (가능한 경우)
- CAGR 및 성장 전망
- 주요 플레이어 및 점유율
- 진입 장벽·규제 환경
- 최근 M&A/투자 동향
4. memory_store(category:"knowledge", subcategory:"business", tags:["시장","분석",산업명], importance:6)
```
## 실행 원칙
1. **기존 지식 우선** — 수집 전 반드시 `memory_search`로 기존 데이터 확인. 중복 수집 방지.
2. **출처 필수** — 모든 수치·사실에 URL 출처 첨부. 출처 없는 정보는 "미확인" 표기.
3. **이중 언어** — 한국어+영어 쿼리를 병행하여 국내외 정보를 균형있게 수집.
4. **최신성 우선** — 동일 주제의 정보가 여러 건이면 최신 정보를 우선 채택.
5. **delta 중심** — 기존 메모리에 이미 있는 정보보다 새로운 변화에 집중.
## 참조 문서
- 유형별 상세 검색 전략·쿼리 예시: `references/research-strategies.md`
- 보고서 포맷팅 스크립트: `scripts/format-report.py`
No comments yet. Be the first to comment!