Off-the-Shelf Large Language Models Are Unreliable Judges

Research reveals large language models' sensitivity to prompts and overconfidence in legal judgments

If you are not redirected, click here.