AI Waifu LLM Prompt Testing EngineerWe are seeking a proactive and detail-oriented Prompt Testing Engineer to join our team. This role focuses on designing, optimizing, and testing prompt strategies for large language models (LLMs) that power anime-inspired AI companions—AI waifus—in our product darlin™(www.darlin.ai).Responsibilities1. Prompt Design Optimization for AI Waifus: Create and refine prompt strategies—such as Chain of Thought Prompting, Reasoning Prompts etc.. enhance AI waifu personality, dialogue authenticity, and behavioral accuracy.2. AI Waifu Benchmark Development Analysis: Design and run benchmarks that evaluate AI waifu performance, including multilingual conversation quality, emotional expression, and personality consistency, using both quantitative and qualitative methods.3. Testing Iteration Optimization for Waifu Interactions: Lead test planning, dataset creation, and iterative refinement cycles focused on improving AI waifu conversational stability, responsiveness, and contextual understanding.4. Dataset Creation for Waifu Scenarios: Work with data scientists to generate, annotate, and clean datasets featuring anime-style dialogue, emotional tone, and scenario-based interactions that reflect each AI waifu’s personality.5. Multilingual Prompt Design for Waifus: Use proficiency in Chinese and English (Japanese is a plus) to design prompts and evaluate AI waifu performance across languages, ensuring tone and cultural nuances are preserved.6. Data Processing Version Control for Waifu Data: Clean, process, and manage waifu-specific datasets using Python, Parquet, Regex, and versioning systems to maintain consistent and traceable data history.7. Advanced Waifu Prompt Engineering: Implement advanced prompt strategies, such as Chain of Thought, Reasoning, and Instruction Prompts, tailored to improve AI waifu reasoning, empathy, and conversation flow, with hands-on Instruct Tuning experience.8. AI Waifu Behavior Capability Analysis: Evaluate AI waifu skills in classification, summarization, reasoning, and personality expression, using results to recommend targeted improvements.9. Continuous Waifu Performance Improvement: Continuously refine AI waifu prompts and behavior through benchmark analysis and feedback loops to keep interactions engaging, authentic, and aligned with user expectations.
AI彼女 LLMプロンプト&テストエンジニア積極的で細部にまで注意を払えるプロンプト&テストエンジニアを募集しています。本ポジションは、当社製品 darlin™(www.darlin.ai)に搭載されるアニメ風AIコンパニオンAI彼女のための大規模言語モデル(LLM)に対するプロンプト設計・最適化・テストを担当します。業務内容1. AI彼女向けプロンプト設計・最適化:Chain of Thought、Reasoning etc..AI彼女の個性、会話の自然さ、行動精度を向上。2. AI彼女用ベンチマーク開発・分析:多言語会話品質、感情表現、キャラクター性の一貫性を含むAI彼女の性能を定量・定性で評価するベンチマークを設計・実行。3. 彼女対話テスト反復・最適化:会話の安定性、応答性、文脈理解を改善するためのテスト計画、データセット作成、反復改良を主導。4. 彼女シナリオ用データセット作成:アニメ調の会話、感情トーン、シナリオベースのやり取りを反映したデータを生成・アノテーション・クレンジング。5. 多言語プロンプト設計:中国語と英語に堪能(日本語能力尚可)で、多言語環境でのAI彼女の会話トーンや文化的ニュアンスを維持。6. 彼女用データ処理・バージョン管理:Parquet、正規表現(Regex)等を使ってAI彼女専用データを処理・管理し、データ履歴を一貫して保持。7. 高度な彼女プロンプトエンジニアリング:推論力、共感性、会話の流れを改善するChain of Thought、推論プロンプト、インストラクションプロンプトを実装し、Instruct Tuning経験を活用。8. 彼女行動・能力分析:分類、要約、推論、キャラクター性表現の評価を行い、改善策を提案。9. 継続的改善:ベンチマーク分析とフィードバックループを通じて、AI彼女のプロンプトと行動を常に魅力的かつ自然に保つ。
No requirement for relevant working experience
No management responsibility