TF-IDF (Term Frequency-Inverse Document Frequency) είναι ένας στατιστικός δείκτης που αξιολογεί τη σπουδαιότητα μιας λέξης μέσα σε ένα συγκεκριμένο κείμενο, σε σχέση με μια ολόκληρη συλλογή κειμένων. Η τεχνική αυτή χρησιμοποιείται ευρέως στην Επεξεργασία Φυσικής Γλώσσας (NLP) και στις μηχανές αναζήτησης.