/
시각장애인 음성 인터페이스
시각장애인 음성 인터페이스
STT/TTS 엔진 통합 — 음성 명령으로 장례 설계 전 과정 안내 (RFP 차별화 핵심)
RFP 2-3 ④ · 차별화 핵심 자산
시각장애인이 음성만으로 장례 절차를 완결할 수 있는 환경을 제공합니다
OpenAI Whisper(음성 인식) + Google Cloud TTS(음성 합성) 통합으로 식장 검색부터 DIY 설계, 가족 분담 결제 요청까지 전 과정을 음성 명령으로 진행합니다. RFP에서 명시적으로 "차별화 기능"으로 정의된 영역입니다.
시스템 누적 음성 세션 (7일)
150건
STT 평균 정확도
95%
TTS 자연도
93점
시각장애인 우선 모드
41건
음성 인터페이스 데모
실시간마이크 버튼을 눌러 음성 데모를 들어보세요
ⓘ 음성: 네이버 클로바더빙 — 한국어 자연도 검증된 사전 녹음 (실 운영은 OpenAI Whisper / Google Cloud TTS)
예: "주변 장례식장 알려줘", "관 기본형으로 선택해줘", "가족에게 결제 요청 보내줘"
대화 시나리오 — 음성으로 장례식장 1·2 순위 등록
사용자 (음성)·10:42:03
주변 장례식장 알려줘
STT 정확도98%
AI 안내 (음성 합성)·10:42:05
현재 위치(서울 강남구) 기준 가장 가까운 장례식장은 삼성서울병원 장례식장입니다. 거리 1.2킬로미터, 평균 비용 920만원, 평점 4.6점입니다. 다음 후보를 들으시겠습니까?
TTS 자연도96점
사용자 (음성)·10:42:14
응, 다음 알려줘
STT 정확도97%
AI 안내 (음성 합성)·10:42:17
두 번째 후보는 서울대학교병원 장례식장입니다. 거리 2.8킬로미터, 평균 비용 880만원, 평점 4.5점입니다. 이 시설을 1순위로 등록하시겠습니까?
TTS 자연도95점
음성 명령으로 가능한 시나리오 (장례 설계 전 과정 커버)
시설 검색
RFP 2-2 ①"주변 장례식장 알려줘"
DIY 설계
RFP 2-3 ②"관 기본형으로 선택"
장지 추천
RFP 2-3 ③"예산 1500만원 안에서 추천"
분담 결제
RFP 2-4 ①"가족 4명에게 결제 요청"
시스템 음성 세션 이력 (운영 지표)
ⓘ 본 표는 시스템 전체 음성 세션 운영 지표입니다. 사용자 본인의 음성 사용 이력은 마이페이지에서 확인 가능합니다.
| 세션 ID | 모드 | STT | TTS | 발화 시간 | 우선 모드 |
|---|---|---|---|---|---|
| VS-20260507-021 | TTS | — | 93점 | 8분 30초 | — |
| VS-20260507-020 | STT | 98% | — | 1분 47초 | — |
| VS-20260507-019 | 양방향 | 95% | 97점 | 3분 4초 | — |
| VS-20260507-018 | TTS | — | 94점 | 4분 21초 | — |
| VS-20260507-017 | STT | 95% | — | 5분 38초 | — |
| VS-20260507-016 | 양방향 | 98% | 98점 | 6분 55초 | — |
| VS-20260507-015 | TTS | — | 94점 | 8분 12초 | — |
| VS-20260507-014 | STT | 97% | — | 1분 29초 | 우선 |
| VS-20260507-013 | 양방향 | 94% | 88점 | 2분 46초 | 우선 |
| VS-20260507-012 | TTS | — | 95점 | 4분 3초 | 우선 |
| VS-20260507-011 | 양방향 | 94% | 92점 | 5분 20초 | 우선 |
| VS-20260507-010 | 양방향 | 97% | 89점 | 6분 37초 | 우선 |