最近在進行的軟體專案與AI模型使用心得
最近我一直在進行一個過去幾年來最困難的軟體專案之一。即使是像Sonet 4這樣的頂級編碼模型,也因專案規模越來越大、細節繁多而感到吃力。在進行專案的過程中,我意識到自己錯誤地使用了DeepSync R1版本2和Sonet 4模型,我認為很多其他開發者可能也犯了同樣的錯誤,只是將它們當作編碼模型來使用。讓我來解釋一下。
AI模型在大型專案中的限制
最近我注意到,當處理具有更深層細節的大型專案時,AI模型開始達到其極限。代碼庫越大,模型就越難追蹤所有內容。特別是像Sonet 4和R1這樣的模型,它們的上下文限制都在200k令牌以下。現在這已經成為一個問題,有點令人瘋狂,但事實就是如此。
如何正確使用模型
儘管如此,這兩個模型在規劃方面其實都非常出色。它們清楚地知道該做什麼,如何分解任務。因此,使用它們的最佳方式實際上是將其作為規劃模型。讓它們引導另一個實際為你編寫代碼的模型。讓我向你展示它是如何實際運作的。
實現方法
這個想法可以通過三個擴展來實現:Kylo code、row code和client。
-
client:它有計劃和執行模式,這其實是很舊的模式。它完全按照我所說的去做。第一個模式是規劃模式。你給它一個非常大的任務,這個任務分布在很多文件中,它會自動進行規劃,完成後,它會將這種規劃傳遞給執行模式,執行模式會為你編寫所有代碼。
-
row code和kyo code:它們也有類似的模式,只是編碼模式被稱為協調器或迴力鏢模式。你給它同樣的任務,即多個文件。它會創建一個計劃,並將這個計劃傳遞給另一個模式,也許是調試模式或編碼模式。
免費使用方法
你可以使用我將要展示的這種設置免費執行這個想法。
-
首先,前往open router,創建一個新帳戶。
-
獲取Deep R1模型,你可以免費使用它,如你所見,百萬輸入和輸出令牌只需$0。它是由shots提供的,基本上每個大型開源模型他們都會免費提供給我們,但速度會很慢,並且有一個限制。我不確定限制率是多少。
-
在router中創建一個帳戶,進入keys,你可以在這裡創建新密鑰。隨便命名,如果你想無限制使用就留空。創建密鑰後,複製它。
-
前往row code或你正在使用的任何擴展,創建新的板文件。我的叫做deepsec R1 free。
-
放入DeepSync的AI密鑰,然後選擇DeepSync R1,它的末尾有免費標籤,以確保它是免費的。點擊保存,就完成了。然後選擇協調器模式。
-
將你的模型切換為DeepSync R1免費版。
編碼模型的選擇
對於編碼,我們將使用Gemini 2.5 flash preview模型,這是flash模型的一個全新版本,是免費的。它每分鐘有10個請求,每天有500個請求。它非常好,有兩種不同的模式,同步模式和非同步模式。我很確定如果你使用同步模式,效果會更好。
-
前往aisudio.google.com,點擊獲取API密鑰,創建新的密鑰。我已經有一個了,複製它。
-
在row code、Kylo code或client中創建新的配置文件,將密鑰放入新的配置文件中。
-
選擇同步模式(如果它已經對你可用)或非同步模式,但老實說,同步模式實際上比非同步模式更好。點擊完成,然後自動切換到編碼模式,選擇flash模型。
現在我們有了協調器,它將使用DeepSync R1,而編碼模型使用flash模型。
DeepSync R1的更新
快速看一下DeepSync R1的新更新,它現在是O4 mini和可能即將發布的Gemini 2.5 Pro之間可用的最智能模型之一。O4 mini非常昂貴,而Gemini 2.5 Pro的評價褒貶不一。DeepSync R1是你可以使用的最慢的模型之一,也是非常便宜的模型之一。它在思維能力上與set for和3.7相當。
實際操作示例
例如,我有一個頁面,其中包含多個組件。每個組件處理這個頁面的不同部分,有多個表單。但這裡有一些問題。我使用的是AR語言(阿拉伯語),但占位符是英文的,這是錯誤的。此外,這個側邊欄應該在右邊,而不是左邊,因為阿拉伯語是RTL語言。 在正常情況下,你會回到Visual Studio Code,選擇編碼模式,告訴它我想處理一個頁面,它有很多組件,需要為阿拉伯語和英語添加翻譯。但一旦你添加文件夾或提及它,任務就會達到上下文限制。 為了正確地做到這一點,我會進入協調器模式或規劃模式。選擇DeepSync R1,我有這個符號提示。我有一個頁面位於這個方向。裡面有一個邏輯,有多個組件,包含不同的輸入。我想從每個組件中刪除所有硬編碼的文本,並告訴它這些組件所在的文件,將所有這些組件放在一起,並為阿拉伯語和英語添加翻譯。翻譯文件在這兩個過濾器中,這個文件的名稱是profile。我還希望如果選定的語言是阿拉伯語,頁面以RTL(從右到左)方式呈現。 當我點擊Enter時,它會自動開始創建一個計劃,等待並進入分析模式,看看需要做什麼。這是完成後的計劃。主要組件在哪裡,翻譯文件在哪裡,以及關鍵要求和子任務指令。這基本上是由DeepSync R1創建的提示,將進入編碼模式。 當我們向下滾動並點擊批准時,它會自動切換到編碼模式,flash模型將接管任務。我選擇了flash思維模型,有兩個原因:第一,它的上下文限制是100萬,所以它有很大的空間來處理很多文件;第二,它非常快。 它已經在這裡創建了第一個編輯,現在已經保存了。編碼任務花了一些時間,使用了148k令牌,因為它必須處理多個文件。如你所見,這個數字幾乎達到了DeepSync R1的限制,如果使用它,只剩下50k令牌來完成整個任務。 所以我點擊完成子任務。它將回到DeepSync R1協調器模式,報告實際發生的情況,分析發生的事情,並告訴我任務現在已完成。我不確定它是如何做到的,但我會檢查任務,看看它是否完成。 它在某種程度上做了我想做的事情。首先,一些輸入已經從LTR切換到RTL,這是正確的。側邊欄仍然在同一個地方,沒有改變。語言仍然沒有顯示在占位符中。所以,我要回去告訴它我有這個錯誤,並在它完成後嘗試修復它。 現在,我有了正確的阿拉伯語占位符翻譯。現在,RTL實際上對所有這些組件都有效。實際上,現在唯一的問題是圖標沒有正確設置。在空格和文本之間必須有某種更多的間距,這樣看起來會更好,但這不是一個問題。
成本效益
我想和你分享的另一件事是,這種流程和使用這些模型的方式實際上為我節省了資金。我這裡有30個關鍵上下文限制的令牌,它只花了25美分,就使用set for為我需要在這個任務中修復的所有事情做了規劃。如你所見,這裡有很多事情在進行,它涉及到很多文件。我將向你展示列表,這只是它在一個文件夾下處理的主要組件。想象一下,Sonet 4去每個文件搜索我想修復的特定問題,然後去修復它。但不,我使用Gemini模型做到了這一點,使用Gemini 2.5 flashing模型只花了11美分,它使用了253,000個令牌。這基本上向你展示了為什麼我現在使用的方法更好的證據。這超過了Sonet 4和DeepSync R1的上下文限制。
適用場景
在結束這個視頻之前,我想談的最後一件事是,你應該什麼時候使用它?它只在你必須處理多個文件時才有效,例如,我這裡有五個文件,我應該打開並處理。基本上,是大量的文件,你在裡面重複同樣的事情。但如果你只處理這些組件中的一個文件,就沒有必要遵循這種方法。你最好堅持使用編碼模式,特別是如果你有一些小問題要解決。但如果你的任務很大,有很多文件,你正在處理一些深入和細節的事情,那麼這就是正確的方法。
結語
這個方法實際上解決了雲端模型最煩人的問題之一。它仍然停留在200k。我的意思是,很多人一直在抱怨,直到現在,速率限制和上下文限制如何搞亂了他們的一些代碼庫,因為代碼開始變得更大,我能找到的唯一解決方法就是這種方法。所以,去吧。我鼓勵你至少嘗試使用DeepSync R1。它是免費的,你可以選擇任何非常快且非常便宜的好模型,從DeepSync R1、Senate或Sonet 4生成你想要的代碼片段。
最後,我還在進行一些工作,但仍在進展中。我正在研究一個新的不同系統,以提高我使用的代碼質量。有一個模式實際上對我非常成功,我自己也在研究。它是一種用於思維flash模型的規則提示。它實際上向我展示了它比row code、kyo或kilo code中的正常角色定義更好。這將是我下一個視頻的主題。
最後,謝謝你觀看。我希望你喜歡並訂閱我的頻道,我們下一個視頻再見。