AI 에이전트를 위한 AI 엔진 이해

list-menu피드백이 있습니까?
이 문서에서는 스크립팅된 AI 에이전트와 자율 AI 에이전트에 사용할 수 있는 다양한 AI 엔진에 대해 간략하게 설명하고 고유한 기능을 자세히 설명합니다. 이 문서에서는 이러한 AI 엔진의 작동 방식과 가장 효과적으로 적용되는 특정 시나리오에 대한 이해를 제공합니다.

AI 엔진은 AI 에이전트를 구동하는 필수 구성 요소입니다. 사용자 입력(텍스트 및 음성)을 처리하고, 사용자 의도를 이해하고, 적절한 응답을 생성합니다.

관리자는 스크립팅된 AI 에이전트의 작동 방식에 가장 적합한 AI 엔진을 선택할 수 있습니다.

AI 엔진의 구성 요소

핵심 구성 요소는 스크립팅된 AI 에이전트와 관련이 있지만 기능은 약간 다릅니다.

  • NLU(자연어 이해): NLU 구성 요소는 고객 입력을 스크립트에 정의된 의도에 매핑합니다. 프레임워크 내에서 고객의 입력을 인식합니다.
  • 대화 관리: 이 구성 요소는 스크립트에 따라 대화의 흐름을 관리합니다. 이를 통해 상담원이 정의된 경로를 따르며 인식된 의도와 컨텍스트에 따라 올바른 응답을 제공할 수 있습니다.
  • 응답 검색: 이 구성 요소는 스크립트에 구성된 응답을 전달합니다.

음성 기반 상호 작용을 위해 AI 엔진에는 위에서 언급한 구성 요소 외에도 ASR(자동 음성 인식) 및 TTS(텍스트 음성 변환)도 포함됩니다.

올바른 엔진을 선택하는 방법

  • Webex AI Pro 2.0(Swiftmatch 포함)

    이는 스크립팅된 AI 에이전트를 위한 최신 생성형 AI 기반 자연어 이해(NLU) 엔진입니다. 고급 기계 학습 알고리즘을 활용하여 사용자 입력을 해석하고 의도를 정확하게 분류합니다. 엔진은 다양한 LLM에서 생성된 언어 패턴을 학습함으로써 구문이나 단어 선택이 다양한 경우에도 사용자가 달성하고자 하는 바를 이해하는 데 높은 정밀도를 제공합니다.

    핵심 경쟁력

    • 의도 인식 개선: 보이지 않는 샘플 또는 입력 변형을 포함한 광범위한 사용자 쿼리를 이해할 수 있어 보다 정확한 의도 분류가 가능합니다.

    • 적응형 학습: 이 모델은 유사한 발화에서 효과적으로 일반화되어 철저한 수동 예제의 필요성을 줄입니다.

    구성 요구 사항 및 제한 사항

    • 각 의도에는 정확한 학습을 위한 충분한 언어 다양성을 모델에 제공하기 위해 10개 이상의 대표 발화가 포함되어야 합니다.

    • 명확하고 의미 있는 의도 설명은 시스템이 밀접하게 관련된 의도를 구별하고 일관된 분류 성능을 유지하는 데 도움이 되므로 필수적입니다.

    • 불충분하거나 모호한 학습 데이터는 특히 언어 패턴이 겹치는 의도의 경우 분류 정확도를 떨어뜨릴 수 있습니다.

  • Webex AI Pro 1.0(Swiftmatch 포함)

    이 AI 엔진은 다양한 사용자 표현을 관리하는 동시에 입력을 사전 정의된 의도에 정확하게 매핑하여 다양한 시나리오에서 일관되고 안정적인 상호 작용을 보장하는 AI 에이전트를 개발하는 데 이상적입니다. 다음과 같은 경우에 유용합니다.

    • 더 작은 학습 데이터 세트 처리: 학습 데이터 세트의 의도당 발화가 10개 미만인 경우 이 엔진이 더 적합합니다.
    • 다국어 스크립트 상담사: 여러 언어로 대화를 처리하는 상담사를 만드는 데 적합합니다.
    • 일정 수준의 "스마트 매칭"이 있는 스크립팅된 에이전트: 응답이 스크립트로 작성되는 동안 이 AI 엔진은 구문이 정확하지 않더라도 사용자 입력을 가장 가까운 의도와 일치시켜 자연스러운 느낌을 제공합니다.

    이점: 입력 변형에 도움이 되고, 더 작은 학습 데이터 세트로 더 좋고, 다국어 지원, 스마트 일치 지원.

    제한 사항 : Swiftmatch는 강력한 자연어 이해 능력이 뛰어납니다. 그러나 스크립트가 사용자 입력을 의도와 일치시키는 데 유연성이 필요한 경우(구문의 변형을 허용함) Swiftmatch는 다양한 학습 데이터로 추가 데이터 구성이 필요할 수 있습니다. 정밀하고 견고한 매칭을 위해 설계되어 핸들링 변형을 더욱 어렵게 만들 수 있습니다.

  • Webex AI Pro 1.0(MindMeld 포함)

    이 AI 엔진은 복잡한 다단계 대화 흐름을 가진 스크립팅된 에이전트에 매우 적합합니다. 다음과 같은 경우에 유용합니다.

    • 중간 학습 데이터 세트 처리: 학습 데이터 세트에 의도당 20개 미만의 발화가 있는 경우 이 엔진이 더 적합합니다.
    • 복잡한 스크립트 워크플로: 스크립트에 여러 단계, 조건 또는 분기 로직이 포함된 경우 MindMeld는 이러한 복잡한 흐름을 관리할 수 있습니다.
    • 다국어 스크립트 에이전트: MindMeld는 여러 언어를 지원합니다.
    • 역할 및 엔터티 분류 수행: 문장 부분과 중요한 세부 정보를 식별하여 사용자 입력에 대한 이해도를 높이고 응답의 정확성과 관련성을 개선합니다.

    장점: 복잡한 스크립트 흐름에 적합하고 중간 데이터 세트에 적합하며 RASA보다 더 정확한 다국어 지원을 제공하며 기본 의도 분류를 위한 간단하고 효율적인 선택입니다.

    제한 사항: MindMeld는 플랫폼의 기존 제한 내에서 복잡한 흐름을 처리할 수 있지만 구조화된 대화에 적합합니다. 스크립트가 매우 유연하고 동적인 대화 관리를 요구하고 대화 흐름이 고객 입력에 따라 크게 바뀔 수 있는 경우 사전 정의된 흐름에 대한 MindMeld의 의존도가 제한될 수 있습니다. 스크립트가 있는 설정에서도 자유 형식과 예측할 수 없는 대화에는 적합하지 않습니다.

AI 엔진은 AI Agent Studio에서 음성 기술(ASR/TTS), 대규모 언어 모델(LLM), 지능형 가드레일 및 전문적으로 제작된 시스템 프롬프트를 하나의 선택 항목으로 결합합니다.

새 AI 에이전트를 만들 때 고유한 요구 사항에 맞게 조정된 여러 AI 엔진 중에서 선택할 수 있습니다.

Autonomous AI 에이전트는 현재 두 가지 AI 엔진 선택 옵션을 제공합니다.

  1. Webex AI Pro 1.0: 글로벌 언어 지원 및 인간과 유사한 상호 작용을 통해 대부분의 컨택 센터 사용 사례에 이상적입니다. 지원되는 언어 및 음성 목록을 보려면 지원되는 언어 및 음성 문서를 참조하세요 .
  2. Webex AI Pro-US 1.0: 향상된 인간과 유사한 대화 환경이 필요한 시나리오에 적합하며 영어로만 제공됩니다.

AI 엔진의 구성 요소

  • 대규모 언어 모델: 고급 인텔리전스로 AI Agent를 구동하여 복잡한 쿼리를 이해하고, 일관된 응답을 생성하고, 작업을 수행하거나, 기술 자료에서 응답할 수 있도록 합니다.

  • 가드레일: 명확한 경계를 설정하고, 부적절한 콘텐츠를 방지하고, 브랜드 안전을 유지하여 책임감 있는 AI 상호 작용을 가능하게 합니다.

  • ASR/STT(Speech-to-Text): 음성 언어를 텍스트로 변환하여 AI 에이전트가 인간의 음성을 이해할 수 있도록 합니다.

  • TTS(Text-to-Speech): 텍스트를 인간과 같은 자연스러운 음성으로 변환하여 AI 에이전트가 명확하고 매력적으로 의사 소통합니다.

  • 중간 응답 모델: 사용자 쿼리에 대한 즉각적인 실시간 응답을 제공하여 응답성이 뛰어나고 유연한 사용자 경험을 제공합니다.

  • TURN 예측 모델: 사용자가 말을 마친 시점을 지능적으로 예측하여 자연스러운 대화 흐름을 촉진합니다.

  • 독립형 쿼리 생성기 모델: 문맥이 없거나 불완전하거나 구어체적인 입력(예: "이자율")을 완전한 자체 포함 쿼리(예: "Home 대출의 이자율은 얼마입니까?")로 변환하여 보다 정확한 검색 및 응답 생성을 가능하게 합니다.

올바른 엔진을 선택하는 방법

  • 언어 지원 : Webex AI Pro-US 1.0은 영어로만 사용할 수 있으며 Webex AI Pro 1.0은 영어 + 베타의 다양한 다른 언어를 지원합니다.
  • 지리적 제한: Webex AI Pro-US 1.0은 미국 고객만 사용할 수 있으며 Webex AI Pro 1.0은 전 세계적으로 사용할 수 있습니다.
  • 음성 경험: Webex AI Pro-US 1.0은 향상된 인간과 유사한 대화 경험을 제공하지만 더 적은 수의 음성으로 제한되는 반면 Webex AI Pro 1.0은 다양한 억양으로 인간과 유사한 상호 작용을 위한 광범위한 음성을 제공합니다.

이 문서가 도움이 되었습니까?
이 문서가 도움이 되었습니까?