Tag: LLM quantization

How to Run Large Language Models on Edge Devices: Compression and Quantization Guide

How to Run Large Language Models on Edge Devices: Compression and Quantization Guide

by Phillip Ramos

Learn how compression and quantization enable Large Language Models to run on edge devices, improving privacy, reducing latency, and saving memory.

Categories

Archives

Recent-posts

Federated Learning for LLMs: Training AI Without Centralizing Data

Federated Learning for LLMs: Training AI Without Centralizing Data

Apr, 9 2026

Domain Adaptation in NLP: Fine-Tuning Large Language Models for Specialized Fields

Domain Adaptation in NLP: Fine-Tuning Large Language Models for Specialized Fields

Feb, 24 2026

Visualization Techniques for Large Language Model Evaluation Results

Visualization Techniques for Large Language Model Evaluation Results

Dec, 24 2025

Few-Shot Fine-Tuning of Large Language Models: When Data Is Scarce

Few-Shot Fine-Tuning of Large Language Models: When Data Is Scarce

Feb, 9 2026

Chunking Strategies That Improve Retrieval Quality for Large Language Model RAG

Chunking Strategies That Improve Retrieval Quality for Large Language Model RAG

Dec, 14 2025