<?xml version="1.1" encoding="utf-8"?>
<article xsi:noNamespaceSchemaLocation="http://jats.nlm.nih.gov/publishing/1.1/xsd/JATS-journalpublishing1-mathml3.xsd" dtd-version="1.1" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"><front><journal-meta><journal-id journal-id-type="publisher-id">RSTD</journal-id><journal-title-group><journal-title>Research on Scientific and Technological Development</journal-title></journal-title-group><issn>3070-0701</issn><eissn>3070-0728</eissn><publisher><publisher-name>Art and Technology</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.61369/RSTD.2026010005</article-id><article-categories><subj-group subj-group-type="heading"><subject>Article</subject></subj-group></article-categories><title>基于 SFT 与 RLHF 的电力生产专属知识库精调方法研究</title><url>https://artdesignp.com/journal/RSTD/1/1/10.61369/RSTD.2026010005</url><author>涂言,覃浩军,范义平,李妍彦</author><pub-date pub-type="publication-year"><year>2026</year></pub-date><volume>1</volume><issue>1</issue><history><date date-type="pub"><published-time>2026-01-20</published-time></date></history><abstract>随着新型电力系统智能化发展，电力生产专属知识库精调成为提升系统运行效率与安全性的关键。本文提出基于监督微调（SFT）与人类反馈强化学习（RLHF）的电力生产专属知识库精调方法，解决传统知识库更新效率低、知识覆盖不全等问题。研究采用 C30 混凝土（配合比 1:1.8:3.2:0.45，28 天抗压强度 32.5MPa）、HRB400 级 &amp;Phi;12mm 纵向筋（屈服强度 420MPa）、HPB300 级 &amp;Phi;6mm 箍筋（屈服强度 300MPa）及单向 CFRP 布（面密度 300g/m&amp;sup2;，抗拉强度 3450MPa）构建知识库，通过 SFT 和 RLHF 优化。实验显示，该方法使电力生产相关问题回答准确率提升 25.6%，有效抑制裂缝发展并提升结构刚度，为电力系统智能化提供技术支持。</abstract><keywords>监督微调,人类反馈强化学习,电力生产,知识库精调,CFRP 加固</keywords></article-meta></front><body/><back><ref-list><ref id="B1" content-type="article"><label>1</label><element-citation publication-type="journal"><p>[1] 李鹏，黄文琦，梁凌宇，等.人机混合增强决策智能在新型电力系统调控中的应用与展望 [J]. 中国电机工程学报，2024, 44 (16): 6359-6368.[2] 李鹏，余涛，李立浧，等.电力人工智能的演变与展望 &amp;mdash;&amp;mdash; 从专业智能走向通用智能 [J]. 电力系统自动化，2024, 48 (15): 1-10.[3] 杨晨芳.基于知识矩阵跨维度迁移的电力调度优化方法 [D]. 北京：华北电力大学，2022.[4] 宋厚岩.基于图数据库的电力系统知识图谱研究与应用 [D]. 哈尔滨：哈尔滨理工大学，2021.[5] 路亚，王郑，李毅.典型电力检修技能提升和作业授权平台研究及应用 [J]. 微型电脑应用，2021, 37 (6): 45-48.</p><pub-id pub-id-type="doi"/></element-citation></ref></ref-list></back></article>
