WritingBench的专用评判模型是该项目的核心技术组件之一。该模型基于Qwen-7B架构专门训练优化,用户需要从HuggingFace平台(AQuarterMile/WritingBench-Critic-Model-Qwen-7B)独立下载后才能使用。
在使用时,用户需要将模型文件放置到本地指定路径,并通过修改evaluator/critic.py中的配置参数来启用评判功能。该模型采用tensor并行技术实现高效评分,但需要适当配置GPU资源以确保性能。
这种模块化设计使评判模型可以独立更新迭代,同时也降低了基础工具包的体积,让用户可以根据需要灵活选择是否使用专业评分功能。
This answer comes from the articleWritingBench: a benchmarking assessment tool to test the writing skills of large modelsThe