분류 전체보기 96

음성파일을 텍스트로 변환하기 - 멀티모달 API

지난 포스팅에서는 OpenAI(ChatGPT), Anthropic(Claude), Google(Gemini), xAI(Grok) 등 주요 AI 챗봇 플랫폼에서 음성 파일을 직접 업로드해 텍스트로 변환(STT) 할 수 있는지 테스트해 보았습니다.이번 글에서는 그 연장선으로, 실제 애플리케이션에 적용하기 위해 API를 사용해 음성 파일을 텍스트로 변환하는 방법을 파이썬 코드 예제와 함께 소개하겠습니다.✔️ 대상 모델OpenAI – 멀티모달 모델 기반 STT - gpt-4o-transcribeGoogle – Gemini 멀티모달 모델 - gemini-3-flash-previewxAI Grok과 Anthropic Claude는 현재 STT를 지원하는 공개 API가 없습니다.✔️ 음성 파일지난 포스팅과 동일한 음..

인공지능/STT 2026.01.21

음성파일을 텍스트로 변환하기 - AI 챗봇 플랫폼

AI 챗봇 플랫폼(OpenAI - ChatGPT, Anthropic - Claude, Google - Gemini, xAI - Grok)에서 음성파일을 텍스트로 변환이 가능한지 테스트해보았습니다.테스트 방법갤럭시폰을 사용하여 음성녹음을 합니다.저장된 녹음 파일을 PC로 전송합니다.녹음 파일을 AI 챗봇 플랫폼에 업로드하여 텍스트로 변환해 달라는 요청을 합니다.AI 챗봇 플랫폼마다의 결과를 확인합니다.✔️ 녹음 파일 내용안녕하세요. 저는 인공지능 음성 인식 기능을 테스트하고 있습니다.오늘 날씨는 조금 춥지만 하늘은 맑습니다.뜬금없지만 제 전화번호는 010-1234-5678입니다.테스트 문장에는 숫자, 날짜, 그리고 일상적인 표현이 포함되어 있습니다.이 음성이 얼마나 정확하게 텍스트로 변환되는지 확인해보겠..

인공지능/STT 2026.01.20

OpenAI GPTs - 02. GPT Action 연습

실제 API 서버를 구축하고 GPT Action을 사용하여 API 호출을 실행하는 방법을 연습합니다. GitHub: https://github.com/just-record/gpts_practice_202410 - 전체 코드연습 내용도시의 현재 날씨 정보 가져오기 - get방식도시의 현재 날씨 정보 가져오기 - post방식도시의 현재 날씨 정보 가져오기 - API Key 사용하여 인증설치# 터미널에서 실행pip install fastapipip install uvicornpip request1. Get 방식API 서버 구축 - Getapp.py: FastAPI 사용from fastapi import FastAPI, HTTPExceptionimport uvicornapp = FastAPI(title="Sim..

OpenAI GPTs - 01. GPT Action

GPTs란https://openai.com/index/introducing-gpts/ChatGPT의 맞춤형 버전: 사용자가 특정 목적에 맞게 커스터마이징 가능GPT 빌더나 편집기를 통해 쉽게 자신만의 GPTs를 만들고 편집 가능instructions(지침), extra knowledge(추가지식), and any combination of skills(다양한 기능)을 결합 가능다른사람과 공유 가능사용법✔️ 다른 블로그 포스트 참조https://spartacodingclub.kr/blog/how-to-use-gptshttps://www.magicaiprompts.com/docs/gpts-complete-guide/how-to-use-gpts/GPT Actionhttps://platform.openai.co..

Python - asser

assert란조건을 테스트하는 디버깅 문: 운영환경에서는 사용 하지 않음조건이 참이면 정상적으로 실행이 계속됩니다.거짓이면 AssertionError가 발생✔️ 사용 사례함수 인수 또는 출력이 유효한지 확인프로그램을 실행하는 동안 특정 조건이 사실인지 확인문장 구조✔️ 기본 문장assert condition ✔️ 메시지 포함assert condition, message예제 코드✔️ 조건이 참이면 정상적으로 실행x = 10assert x > 0, "x must be positive" ✔️ 조건이 거짓이면 AssertionError 발생x = -10assert x > 0, "x must be positive"실행 결과Traceback (most recent call last): File "assert.py..

Python/중급 2024.10.22

vLLM - 02. vLLM 연습하기

기본 사용을 시작으로 하여 생각나는 대로 연습해 보았습니다.기본 사용기본적인 사용 방법으로 시작from vllm import LLM, SamplingParams# Initialize the model# llm = LLM(model="facebook/opt-125m")llm = LLM(model="gpt2")# Set up the promptprompt = "Tell me a short story about a robot learning to paint:"# Set up sampling parameterssampling_params = SamplingParams(temperature=0.8, top_p=0.95, max_tokens=1000)# Generate the outputoutput = llm.ge..

인공지능/LLM 2024.10.21

vLLM - 01. Getting Started

vLLM란?Github: https://github.com/vllm-project/vllm?tab=readme-ov-fileDocumentation: https://docs.vllm.ai/en/stable/대규모 언어 모델(LLM)의 효율적인 실행을 위한 오픈소스 시스템입메모리 사용 최적화와 고성능 추론을 목표로 설계되었습니다.기존보다 더 큰 언어 모델을 적은 자원으로도 실행할 수 있으며, 빠른 응답 속도를 가짐✔️ PagedAttentionvLLM의 핵심 기술 중 하나로 GPU 메모리를 작은 블록으로 나누어 관리불필요한 메모리 할당을 줄이고, 동시에 여러 요청을 처리설치✔️ 설치 옵션Installation (기본 설치): 일반적인 GPU 환경에서의 기본 설치 방법. CUDA가 설치된 환경을 위한 것.I..

인공지능/LLM 2024.10.17

Gradio - 01. Getting Started

Gradio란?https://www.gradio.app/https://www.gradio.app/guides/quickstart오픈소스 Python 패키지머신러닝 모델, API 또는 임의의 Python 함수에 대한 데모나 웹 애플리케이션을 신속하게 구축내장된 공유 기능으로 몇 초 만에 공개 링크 생성JavaScript, CSS, 또는 웹 호스팅 경험이 필요 없음설치Python 3.10 또는 그 이상이 필요가상환경에서 설치 권장: https://www.gradio.app/main/guides/installing-gradio-in-a-virtual-environment# 가상환경 생성 - linux# python -m venv gradio-env# source gradio-env/bin/activatepip..

Ollama - 01. 설치 및 기본 사용

Ollama란?https://ollama.com/ ollama는 대규모 언어 모델(Large Language Models, LLMs)을 로컬 환경에서 쉽게 실행할 수 있게 해주는 오픈소스 프레임워크입니다. 이 도구는 복잡한 AI 모델을 개인용 컴퓨터나 서버에서 간편하게 구동할 수 있도록 설계되었습니다. ✔️ 주요 목적LLMs의 접근성 향상로컬 환경에서의 AI 모델 실행 간소화다양한 AI 모델의 쉬운 관리 및 사용✔️ ollama의 특징과 장점로컬 실행인터넷 연결 없이 모델 사용 가능데이터 프라이버시 및 보안 강화지연 시간 감소로 빠른 응답 속도사용 편의성간단한 명령어로 모델 다운로드 및 실행복잡한 설정 없이 바로 사용 가능사용자 친화적인 CLI 인터페이스다양한 모델 지원:Llama 3.1, Phi 3, ..

인공지능/LLM 2024.08.14

Hugging Face - 02. Transformers - AutoClass

Transformer공식문서: https://huggingface.co/docs/transformers/index위의 공식 문서를 연습 한 곳: https://github.com/just-record/huggingface_practice 🤗 Transformers는 최신의 사전 훈련된 모델을 쉽게 다운로드하고 훈련할 수 있는 API와 도구를 제공합니다.설치pip install transformers, datasets, evaluate, acceleratepip install torch # PyTorchpip install tensorflow # TensorFlowAutoClasshttps://huggingface.co/docs/transformers/autoclass_tutorial Aut..