Ollama

Ollama API

Ollama provides a REST API for running and managing large language models locally. The API supports text generation, chat completions, embeddings, model management, and streaming responses. It serves as the primary interface for interacting with models running on the Ollama inference engine at localhost:11434.

Documentation GitHub OpenAPI

Documentation

https://docs.ollama.com/

https://docs.ollama.com/api/authentication

https://docs.ollama.com/api/generate

https://docs.ollama.com/api/chat

https://docs.ollama.com/api/embed

https://docs.ollama.com/api/tags

https://docs.ollama.com/api/ps

https://docs.ollama.com/api/create

https://docs.ollama.com/api/pull

https://docs.ollama.com/api/push

https://docs.ollama.com/api/copy

https://docs.ollama.com/api/delete

https://docs.ollama.com/api/show

https://docs.ollama.com/api/streaming

https://docs.ollama.com/api/errors

https://docs.ollama.com/api/usage

https://docs.ollama.com/api/blobs

https://docs.ollama.com/api/version

Specifications

https://docs.ollama.com/openapi.yaml

Other Resources

Getting Started

https://docs.ollama.com/api/introduction

OpenAPI Specification