factuality

#自然语言处理#WikiChat is an improved RAG. It stops the hallucination of large language models by retrieving data from a corpus.

自然语言处理聊天机器人 factuality emnlp2023 rag 大语言模型

Python 1.52 k

5 个月前

Libr-AI / OpenFactVerification

Loki: Open-source solution designed to automate the process of verifying factuality

人工智能 factuality hallucination

Python 1.11 k

1 年前

google-deepmind / long-form-factuality

Benchmarking long-form factuality in large language models. Original code for our paper "Long-form factuality in large language models".

benchmark dataset evaluation factuality language language-modeling large-language-models 监控

Python 640

1 个月前

voidism / DoLa

Official implementation for the paper "DoLa: Decoding by Contrasting Layers Improves Factuality in Large Language Models"

factuality hallucinations large-language-models

Python 512

8 个月前

amazon-science / RefChecker

RefChecker provides automatic checking pipeline and benchmark dataset for detecting fine-grained hallucinations generated by Large Language Models.

factuality hallucination 大语言模型

Python 392

4 个月前

shmsw25 / FActScore

A package to evaluate factuality of long-form generation. Original implementation of our EMNLP 2023 paper "FActScore: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text Generation"

factuality language language-modeling evaluation emnlp2023

Python 380

5 个月前

chaitanyamalaviya / ExpertQA

[Data + code] ExpertQA : Expert-Curated Questions and Attributed Answers

expert factuality

Python 133

2 年前

voidism / Lookback-Lens

Code for the EMNLP 2024 paper "Detecting and Mitigating Contextual Hallucinations in Large Language Models Using Only Attention Maps"

hallucinations large-language-models text-generation factuality

Python 130

1 年前

BharathxD / ClaimeAI

#大语言模型#This AI fact-checking system, built with LangGraph, dissects text into verifiable claims, cross-referencing them with real-world evidence via web searches. It then generates detailed accuracy reports,...

人工智能 fact-checking factuality langgraph 大语言模型 tavily verification

TypeScript 67

1 个月前

salesforce / factualNLG

#自然语言处理#Code for the arXiv paper: "LLMs as Factual Reasoners: Insights from Existing Benchmarks and Beyond"

自然语言处理 factuality large-language-models 大语言模型 summarization

Jupyter Notebook 59

8 个月前

amazon-science / fact-graph

Implementation of the paper "FactGraph: Evaluating Factuality in Summarization with Semantic Graph Representations (NAACL 2022)"

factuality

Python 50

2 年前

dmis-lab / OLAPH

OLAPH: Improving Factuality in Biomedical Long-form Question Answering

factuality hallucination question-answering

Python 38

1 年前

pphuc25 / distil-cd

#自然语言处理#Distillation Contrastive Decoding: Improving LLMs Reasoning with Contrastive Decoding and Distillation

decoding 自然语言处理 Bukkit factuality

Python 35

2 年前

ChanLiang / CONNER

#大语言模型#[EMNLP 2023] Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge Generators

llm-evaluation hallucinations emnlp2023 large-language-models factuality ChatGPT llama

Python 32

2 年前

zjunlp / KnowRL

KnowRL: Exploring Knowledgeable Reinforcement Learning for Factuality

factuality hallucination question-answering reinforcement-learning

Python 29

2 个月前

JayZhang42 / SLED

#大语言模型#SLED: Self Logits Evolution Decoding for Improving Factuality in Large Language Model https://arxiv.org/pdf/2411.02433

decoding factuality Google llama llama2 llama3 大语言模型 llm-inference meta openai large-language-models

Python 28

9 个月前

khuangaf / CHOCOLATE

Code and data for the ACL 2024 Findings paper "Do LVLMs Understand Charts? Analyzing and Correcting Factual Errors in Chart Captioning"

chart-understanding factuality large-vision-language-models

Jupyter Notebook 26

1 年前

MiuLab / FactAlign

Source code of our EMNLP 2024 paper "FactAlign: Long-form Factuality Alignment of Large Language Models"

alignment factuality large-language-models

Jupyter Notebook 19

1 年前

amazon-science / factual-confidence-of-llms

#大语言模型#Code for paper "Factual Confidence of LLMs: on Reliability and Robustness of Current Estimators"

factuality 大语言模型 robustness

Python 15

9 个月前

mbzuai-nlp / fire

#大语言模型#A lightweight, agent-style framework for fact-checking atomic claims using iterative retrieval and verification. Reduces LLM and search cost while maintaining strong factuality performance.

factuality 框架大语言模型 llm-agent retrieval verification

Python 12

3 个月前

Website
Wikipedia