/

시각장애인 음성 인터페이스

시각장애인 음성 인터페이스

STT/TTS 엔진 통합 — 음성 명령으로 장례 설계 전 과정 안내 (RFP 차별화 핵심)

RFP 2-3 ④ · 차별화 핵심 자산

시각장애인이 음성만으로 장례 절차를 완결할 수 있는 환경을 제공합니다

OpenAI Whisper(음성 인식) + Google Cloud TTS(음성 합성) 통합으로 식장 검색부터 DIY 설계, 가족 분담 결제 요청까지 전 과정을 음성 명령으로 진행합니다. RFP에서 명시적으로 "차별화 기능"으로 정의된 영역입니다.

시스템 누적 음성 세션 (7일)

150

STT 평균 정확도

95%

TTS 자연도

93

시각장애인 우선 모드

41

음성 인터페이스 데모

실시간

마이크 버튼을 눌러 음성 데모를 들어보세요

ⓘ 음성: 네이버 클로바더빙 — 한국어 자연도 검증된 사전 녹음 (실 운영은 OpenAI Whisper / Google Cloud TTS)

예: "주변 장례식장 알려줘", "관 기본형으로 선택해줘", "가족에게 결제 요청 보내줘"

대화 시나리오 — 음성으로 장례식장 1·2 순위 등록

사용자 (음성)·10:42:03
주변 장례식장 알려줘
STT 정확도98%
AI 안내 (음성 합성)·10:42:05
현재 위치(서울 강남구) 기준 가장 가까운 장례식장은 삼성서울병원 장례식장입니다. 거리 1.2킬로미터, 평균 비용 920만원, 평점 4.6점입니다. 다음 후보를 들으시겠습니까?
TTS 자연도96
사용자 (음성)·10:42:14
응, 다음 알려줘
STT 정확도97%
AI 안내 (음성 합성)·10:42:17
두 번째 후보는 서울대학교병원 장례식장입니다. 거리 2.8킬로미터, 평균 비용 880만원, 평점 4.5점입니다. 이 시설을 1순위로 등록하시겠습니까?
TTS 자연도95

음성 명령으로 가능한 시나리오 (장례 설계 전 과정 커버)

시설 검색

RFP 2-2 ①

"주변 장례식장 알려줘"

DIY 설계

RFP 2-3 ②

"관 기본형으로 선택"

장지 추천

RFP 2-3 ③

"예산 1500만원 안에서 추천"

분담 결제

RFP 2-4 ①

"가족 4명에게 결제 요청"

시스템 음성 세션 이력 (운영 지표)

ⓘ 본 표는 시스템 전체 음성 세션 운영 지표입니다. 사용자 본인의 음성 사용 이력은 마이페이지에서 확인 가능합니다.

세션 ID모드STTTTS발화 시간우선 모드
VS-20260507-021TTS93점830
VS-20260507-020STT98%147
VS-20260507-019양방향95%97점34
VS-20260507-018TTS94점421
VS-20260507-017STT95%538
VS-20260507-016양방향98%98점655
VS-20260507-015TTS94점812
VS-20260507-014STT97%129우선
VS-20260507-013양방향94%88점246우선
VS-20260507-012TTS95점43우선
VS-20260507-011양방향94%92점520우선
VS-20260507-010양방향97%89점637우선