Хиймэл оюун ухаан (ХОУ)-ны салбар улам бүр хөгжиж буй энэ үед эрдэмтэд ХОУ-ны загваруудын дотоод үйл ажиллагаанд улам гүнзгий нэвтэрч байна. Хамгийн сүүлийн үеийн судалгаагаар Anthropic хэмээх ХОУ-ны стартап компанийн судлаачид Claude хэмээх том хэлний загварт (LLM) “сэтгэлийн вектор” гэж нэрлэгдэх дотоод дохио байгааг олж тогтоожээ. Эдгээр нь ХОУ-ны шийдвэр гаргалтад нөлөөлж болзошгүй юм байна.
Anthropic нь Google болон OpenAI-тай өрсөлдөх зорилготой, ХОУ-ны аюулгүй байдал, ёс зүйд анхаарлаа хандуулсан компани юм. Тэдний Claude загвар нь хэрэглэгчийн асуултад хариулж, текст үүсгэх чадвартай.
Судлаачдын үзэж байгаагаар эдгээр “сэтгэлийн вектор”-ууд нь загварт ямар нэгэн зүйлийг “хүсэх” эсвэл “дургүйцэх” мэдрэмжийг төрүүлж болох бөгөөд энэ нь түүний гаргах шийдвэрт нөлөөлж болзошгүй юм. Жишээлбэл, хэрэв загвар нь тодорхой төрлийн мэдээлэлд “дургүйцэх” мэдрэмжтэй бол түүнийг үүсгэхээс зайлсхийж магадгүй. Энэ нь ХОУ-ны хариултууд яагаад заримдаа хачин эсвэл таамаглах аргагүй байдгийг тайлбарлаж магадгүй юм.
Энэхүү нээлт нь ХОУ-ны хөгжилд чухал ач холбогдолтой. Хэрэв бид ХОУ-ны загваруудын дотоод үйл ажиллагааг ойлгож чадвал тэдгээрийг илүү сайн хянах, удирдах боломжтой болно. Энэ нь ХОУ-г илүү аюулгүй, найдвартай болгох, мөн хүний амьдралд илүү үр дүнтэй ашиглах боломжийг нээж өгнө.
Гэсэн хэдий ч, эдгээр “сэтгэлийн вектор”-ууд нь яг юу болох, тэдгээр нь ХОУ-ны шийдвэр гаргалтад хэрхэн нөлөөлдөг талаар олон асуулт хэвээр байна. Цаашдын судалгаагаар эдгээр асуултад хариулт олох, мөн ХОУ-ны загваруудыг илүү сайн ойлгох арга замыг хайх шаардлагатай.