AssemblyAI Slam-1 v1

Slam-1 is a Speech Language Model that combines LLM architecture with ASR encoders for superior speech-to-text transcription. It is optimized for customization via prompting and delivers enhanced accuracy by understanding context and semantic meaning. It is currently in public beta.

Provider

AssemblyAI

Model Type

contextual

Accuracy Tier

premium

Release Date

March 5, 2025

Supported Languages

en-US

Performance & Cost

Cost

$0.37000/hour

$0.00010/second

Maximum Duration

10h 0m

Maximum File Size

5.00 GB

Features

Supported capabilities and functionalities

Core Features

Punctuation

Diarization

Streaming

Speaker Labels

Word Timestamps

Confidence Scores

Language Detection

Custom Vocabulary

Profanity Filtering

Noise Reduction

Technical Specifications

Input/output formats and technical details

Supported Audio Encodings

LINEAR16MULAWFLACMP3AACM4AMP4MOVAVIMKVm4pwma

Supported Sample Rates

8000 Hz16000 Hz22050 Hz44100 Hz48000 Hz