Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

워크스페이스

대규모 기업 조직이나 연구 개발 센터에서 다중 사용자 기반의 프라이빗 인프라를 효율적으로 운영하기 위해서는 사용자의 편의성을 도모하고 컴퓨팅 자원을 합리적으로 활용하는 자산 설계가 필수적입니다. Open WebUI는 웹 인터페이스상에서 직접 모델과 템플릿을 커스터마이징하는 Workspace 자산 엔진과, 시스템 무거운 부하를 최적화하는 Task Models 아키텍처를 제공하여 최상의 관리 가용성을 지원합니다.

1워크스페이스 커스텀 자산 관리

관리자 및 일반 권한 사용자가 플랫폼 내부에서 독자적인 모델 사양과 공용 자산을 생성하여 사내 전체에 전파하고 공유할 수 있는 자산 허브입니다.

1.1커스텀 모델 정의 (Workspace Models)

1.2프롬프트 템플릿 공유 (Workspace Prompts)

1.3지식베이스 구조화 (Workspace Knowledge Bases)

1.4실시간 컨텍스트 메모리: 노트 (Workspace Notes)

1.5지능형 행동 스킬: 스킬 (Workspace Skills) 개발

2인프라 고가용성을 위한 태스크 모델 (Task Models) 오프로딩

사용자가 메인 추론용 초대형 모델(예: 70B 규모 MoE 모델)과 긴 대화를 이어나갈 때, 시스템 백그라운드에서는 대화방 제목 생성(Title Generation), RAG 검색을 위한 사용자 질문 재정제(Query Refinement), 대화 주제 자동 분류(Tagging) 등 수많은 부차적인 추론 연산이 쉼 없이 자동 가동됩니다.

이러한 부가 태스크들을 전부 고비용 GPU 클러스터를 사용하는 메인 추론 모델에 맡기는 것은 엄청난 연산 VRAM의 낭비이자 추론 대기 시간(Latency)의 급격한 상승을 야기하는 비효율의 주원인입니다.

2.1특화 소형 모델 오프로딩 아키텍처

Open WebUI는 이러한 운영 비효율을 완벽히 소거하기 위해, 부차적인 배경 연산들을 전담하여 처리하는 태스크 모델(Task Models) 설정을 지원합니다.