I. 研究の結論
1.全体的な結論
この研究の結果は、現在ローカルで見つけることができる高いコンピューティング能力条件下で、DeepSeek モデルの基本バージョンを実行することは、依然として大きな課題に直面していることを示している。具体的には、構築コストが高すぎ、継続的な質疑応答や開発支援のような一般的なシナリオをサポートするには、パフォーマンスと品質の面でまだ十分ではありません。
ある製品に適用するために、DeepSeek モデルのベースバージョンに基づいて特殊なモデルをトレーニン グする場合は、同時実行性、適時性などの観点から、アプリケーションシナリオの技術要件を注意深く 検討する必要があります。ベースモデルのサイズと製品の目標演算量の関係を合理的に評価し、製品のコストと効果のバラン スを取る必要があります。
現在のローカルハードウェア環境下での DeepSeek モデルの動作には多くの制約があるが、全く未開拓というわけではない。ビデオメモリの大容量化やより効率的なハードウェアアーキテ クチャの採用等、ハードウェアコストの適切な上昇を前提とし、同時に 7B のような小型モデルをベースとした蒸留学習等の技術的手段を強化することで、モデルク イズの質を向上させ、よりローカルアプリケーションのニーズに応えることが可能となる。また、既存のハードウェア条件下でモデルの性能をさらに向上させるために、モデルのアルゴリズムやパラメータのデバッグを最適化する方法を深く探求することも可能である。
2.異なるローカルモデルのパフォーマンス
DeepSeek R1 は、DeepSeek の Web サイトからモデルをローカルに展開するための最小構成要件に基 づき、利用可能な優れたハードウェア(NVIDIA A100 80G グラフィックスメモリ 2 枚など)と組み合わ せて最大 70b のモデル実行をサポートできましたが、671b のフルモデルを実行することはでき ませんでした。
1.5bは効果がなく、70bと7bを中心に比較検証した。
また、我々は最初に70bモデルの応答速度が遅すぎることを発見したシングルカードのテストを実施し、デュアルカードのテストは、単一のデュアルカードの理論的な性能差(推論性能の速度に異なる算術の影響の同じモデルは、理論的には品質に影響を与えませんが、単純な検証も理論的なシナリオに沿っている)、したがって、我々はデュアルカードの実験環境は、唯一の検証の広い範囲の7bモデルを使用しています。
7bモデリング性能:5人フル装備テストでは、7bモデルは最初のQ&Aでは比較的速く回答した(デュアルカードでは35秒近く、シングルカードでは70秒近く)。回答内容の構成と質は中程度であったが、いくつかの複雑な推論的質問や連続的なフォローアップ質問をした後、文脈の成長により、7bモデルは、回答速度は安定していたものの、支離滅裂な、でっち上げの、思いつきの回答が見られるようになった。
70bモデリング性能:5人フル負荷テストでは、70bモデルは同じ質問に対する最初の回答が非常に遅かった(シングルカードでは7分以上、デュアルカードでは単純な検証のみで詳細なテストは行っていない)。回答内容は、構成、レイアウト、質ともに7bモデルよりは少しましでしたが、7bモデルの回答には遠く及ばず、文脈が長くなるにつれ(7bモデルより長い)、70bモデルも回答の質の低さ、論理の混乱、作り話といった同じ現象が見られました。特に、70bの応答時間は利用可能なハードウェアに対して長すぎるため、ユーザーエクスペリエンスが悪く、品質スコアに深刻な影響を与えている。
最後に、ユーザーの評価データを通じて、7bと70bの両モデルは応答内容の質という点では不合格であったが、7bモデルは比較的応答が速いため、ユーザーの満足度はやや高かった。
3.ローカル70bモデルと公式ウェブモデルの比較
70bの模範解答は平均的なクオリティ。
70b モデルに対する回答の質については、いくつかのテストを実施しました。同じ質問を、ローカルに配置された DeepSeek-R1:70b モデルと、オンラインの DeepSeek 公式 Web サイト (つまり、完全な DeepSeek-R1 モデル) に対して行いました。
まず、反応速度に違いがある。ローカルモデルの70bでは約70秒(1人テスト)、オフィシャルウェブ側では約30秒(1人テスト)。
二つ目は、両者の回答内容の質の違いである。70bモデルでは、通常の知識クイズ問題では単純な回答が、推理問題では複雑な問題でも不正解が出ることがあるのに対し、公式フルブラッド版では、単純な知識クイズでも複雑な推理問題でも、より実戦に近い詳細で具体的な質の回答が出る。
4.異なるハードウェアの下での搭載ユーザー数の評価
シングルカードA100:7bモデルで約3~4人、70bモデルで約1~2人のユーザーを搭載するのが理想的。
デュアルSIM A100:7bモデルでは、理想的なユーザー数は8~10人程度。
さらに、デュアル・カード・モードでの応答の質は、シングル・カード・モードの7bモデルと基本的に同じである。伝送されたユーザー数やレスポンスなどの指標の改善は、基本的に線形、すなわち1+1≈2である。
5.500人の同時ユーザーをホストするためのハードウェア・コストの見積もり
最低でも7bモデルのハードウェア導入コストは約300万ドルと推定される。
最初の応答時間(70秒)を最大許容キューイング時間としてください。同社のR&Dに約500人を使用するには、少なくとも100ウェイ並行計算をサポートする必要があり、クラスタモードのための複数のサーバーアーキテクチャである必要があり、ユニットとして4カードA100を想定すると、単一のユニットは、20ウェイ並行処理をサポートすることができますし、5台のサーバーにクラスタを形成する必要があり、関連するハードウェアのコストは約300万元の最小値である必要があります。
まとめると、DeepSeek-R1:7bのローカルモデルをより多くの人が同時に使用することをサポートする必要があり、ハードウェアのコストが比較的高く、システムの安定した運用を確保するためには、ネットワーク帯域幅やサーバーの性能など、その他の要因も実際のアプリケーションで考慮する必要があります。
同時に、ユーザーの増加やピーク時のモデルアップ需要に対応するため、システムの信頼性と拡張性を確保するために、ハードウェアの冗長性を適切に高める(例えば、10%~20%のハードウェアリソースを増やす)必要があり、実際の投資コストは300万人民元よりはるかに大きくなる可能性がある。
II.実験環境とモダリティ
1.DeepSeekリリースノート:
DeepSeekのR1推論モデルのバージョンの選択については、公式サイトの最小構成要件によると
4ビットの量子化ユニットを持つollamaを使用しているが、ビデオメモリ≒参加者数/2=335G≒80*4であるため、671Bバージョンのモデルを展開するには、少なくとも5台のA100が必要となる。
そのため、この用途のハードウェア環境では、最大でもA100 80Gのグラフィックカード2枚のみで、この条件下ではDeepSeek - R1の70Bモデルの最大動作にしか対応できない。
2.実験環境
- モデリング DeepSeek-r1:7bモデル、DeepSeek-r1:70bモデル
- サーバNF5280M5
- ディスプレイカードNVIDIA A100 80GB PCIe *2、シングルカードとデュアルカードに分かれています。
3.試験方法
- シングルカード試験 7bモデルと70bモデルの平均レスポンスタイムとGPU負荷を同時5ユーザーで測定し、テスターはレスポンスの質に基づいてモデルのパフォーマンスに対する満足度を評価した。
- デュアルSIMテスト 評価7bは、同時に5人で使用し、徐々にユーザー数を増やしながら、GPUの負荷とレスポンスタイムの消費を観察しました。
III.データ概要
これは1時間で行われたクイズのテストデータの統計である。
ハードウェア環境 | モデリング | 利用者数(人) | 平均応答時間(秒) | GPU負荷 | ユーザー満足度(100点) |
シングルカード A100 | 7b | 5 | 68.90 | 100% | 47.05 |
シングルカード A100 | 70b | 5 | 461.61 | 100% | 45.27 |
デュアルSIM A100 | 7b | 5 | 33.14 | 90% | – |
デュアルSIM A100 | 7b | 11 | 81.79 | 100% | – |
データ分析
1.シングルカードとデュアルカードの性能比較
- 7bモデルを5人で使用した場合のシングルカードとデュアルカードのデータから、デュアルカードの平均レスポンスタイムはシングルカードの約2倍(シングルカード68.90秒、デュアルカード33.14秒)であるが、GPU負荷に関してはデュアルカードは全負荷限界に達しておらず、10%程度のマージンが残っている。このことから、同じユーザー数・機種を扱った場合、レスポンスタイムは短縮されるものの、デュアルカードによる大幅な性能向上は見込めないことがわかる。
- デュアルカードのユーザー数が11人まで増加し続けると、平均回答時間は約80秒に上昇し、7bモデルを5人で使用した場合のシングルカードでの回答時間(68.90秒)に近くなり、GPUはフルキャパシティに達する。このことは、デュアルカードの能力が11人程度で飽和に近いことを示している。
2.モデルサイズが性能に与える影響
シングルカード環境では、同じユーザー数(5)の場合、70b モデルは 7b モデルと比較して平均レスポンスタイムが大幅に増加し(461.61 秒対 68.90 秒)、両方の GPU がフルロードの限界に達しています。これは、モデルのサイズがレスポンスタイムに大きく影響することを示唆しており、同じユーザーリクエストをシングルカードのハードウェアで処理する場合、より大きなモデルはより時間がかかり、より大きなパフォーマンスプレッシャーにさらされます。
3.モデルの応答満足度の比較
シングルカード環境では、参加者に7bモデルと70bモデルそれぞれの解答の質と回答速度を考えてもらい、モデルの総合的な質を採点した。 100点満点で、70bモデルは45.27点、7bモデルは47.05点となり、ともに不合格となった。なお、デュアルカード環境については、7bモデルをそのまま使用したため、回答内容に変化はなく、成績の採点には関与しなかった。
平均点を見ると、両者にほとんど差はなく、7B型が70B型よりもレスポンスが速いため、性能の満足度ではやや上回っている。
V. 関連する実験データ
1.シングルカード70bモデル
測定データは以下の通り:
シリアル番号 | レスポンス・トークン率(response_token/s) | プロンプト・トークン・レート(prompt_token/s) | 総所要時間(total_duration) | ロード時間(load_duration) | プロンプト評価期間 (prompt_eval_duration) | 評価期間 (eval_duration) | プロンプト評価回数 (prompt_eval_count) | 評価回数 (eval_count) | おおよその合計 (approximate_total) |
1 | 7.4 | 355.2 | 4283113421231 | 64926183 | 4420000000 | 218494000000 | 157 | 1617 | 0h7m8s |
2 | 7.48 | 81.33 | 1045634640765 | 68951189 | 3320000000 | 187176000000 | 27 | 1400 | 0時間17分25秒 |
3 | 8.04 | 344.35 | 24894132815 | 71000796 | 12400000000 | 8426000000 | 427 | 470 | 0時間4分48秒 |
4 | 7.5 | 337.59 | 591143315288 | 45644958 | 1724000000 | 12407000000 | 582 | 93 | 0時間9分51秒 |
5 | 9.91 | 29.7 | 404229221982 | 47558712 | 505000000 | 39875000000 | 15 | 395 | 0時間5分40秒 |
6 | 14.33 | 232.67 | 130453080347 | 1068651783 | 8510000000 | 117870000000 | 198 | 1689 | 0時間2分10秒 |
7 | 6.72 | 18.76 | 95210741192 | 48216793 | 5330000000 | 198665000000 | 10 | 1321 | 0時間15分52秒 |
8 | 8.23 | 79.55 | 98536075497 | 48032930 | 3520000000 | 219607000000 | 28 | 1807 | 0時間16分35秒 |
9 | 8.57 | 15.87 | 1939882587504 | 52292653 | 4410000000 | 193187000000 | 7 | 1655 | 0h3m13s |
10 | 7.78 | 92.9 | 203144306266 | 51738331 | 1830000000 | 167322000000 | 17 | 1302 | 0h3m23s |
11 | 8.13 | 117.29 | 239838846247 | 43393536 | 3240000000 | 234391000000 | 38 | 1005 | 0時間3分52秒 |
12 | 7.53 | 15.87 | 5212125785230 | 46219772 | 3070000000 | 193187000000 | 6 | 1552 | 0時間4分41秒 |
13 | 7.22 | 37.38 | 472712581796 | 56530817 | 2140000000 | 151867000000 | 8 | 1097 | 0時間7分52秒 |
14 | 6.76 | 355.78 | 786198638097 | 52828335 | 3297000000 | 250036000000 | 1173 | 1689 | 0時間13分6秒 |
15 | 7.48 | 81.33 | 1045634640765 | 68951189 | 3320000000 | 187176000000 | 27 | 1400 | 0時間17分25秒 |
16 | 7.46 | 328.71 | 1074760952244 | 55115370 | 1809000000 | 270544000000 | 583 | 2019 | 0時間17分54秒 |
17 | 7.55 | 67.62 | 1035246489195 | 43186618 | 2810000000 | 180891000000 | 19 | 1365 | 0時間17分15秒 |
18 | 8.2 | 69.2 | 231120109216 | 65393535 | 2890000000 | 102891000000 | 20 | 844 | 0h3m51s |
19 | 8.04 | 344.35 | 24894132815 | 71000796 | 12400000000 | 8426000000 | 427 | 470 | 0時間4分48秒 |
20 | 7.46 | 531 | 298843367796 | 35052474 | 2260000000 | 163617000000 | 12 | 1220 | 0時間4分58秒 |
21 | 8.12 | 367.32 | 160780214661 | 29093937 | 13830000000 | 85020000000 | 508 | 69 | 0h2m46s |
22 | 7.5 | 337.59 | 591143315288 | 45644958 | 1724000000 | 12407000000 | 582 | 93 | 0時間9分51秒 |
23 | 8.71 | 47.46 | 8892981852348 | 55347279 | 2950000000 | 116917000000 | 14 | 1018 | 0時間14分52秒 |
24 | 7.57 | 40.54 | 372006145019 | 57666960 | 2960000000 | 230779000000 | 12 | 1748 | 0時間6分12秒 |
25 | 7.29 | 312.13 | 394296371542 | 52036868 | 6414000000 | 201349000000 | 2002 | 1468 | 0時間6分34秒 |
26 | 7.4 | 355.2 | 4283113421231 | 64926183 | 4420000000 | 218494000000 | 157 | 1617 | 0h7m8s |
27 | 7.45 | 343.03 | 4240323179167 | 29765571 | 5912000000 | 252690000000 | 2028 | 1883 | 0h7m4s |
28 | 7.39 | 347.62 | 343393037822 | 445458914 | 3849000000 | 198053000000 | 1338 | 1463 | 0時間5分43秒 |
29 | 7.68 | 355.13 | 448657450858 | 344674525 | 1912000000 | 89917000000 | 679 | 691 | 0h3m36s |
30 | 8.65 | 223.11 | 367343951946 | 44474014 | 5020000000 | 80331000000 | 112 | 695 | 0h6m7s |
31 | 8.87 | 159.34 | 46850899401 | 80106631 | 1820000000 | 41840000000 | 29 | 371 | 0h0m46s |
統計結果
- おおよその合計時間 (approximate_total 集合体)14,310秒(つまり3時間55分10秒)
- おおよその平均合計時間 (approximate_total 平均値)461.61秒(約7分41秒)
2.シングルカード7bモデル
シリアル番号 | レスポンス・トークン率(response_token/s) | プロンプト・トークン・レート(prompt_token/s) | 総所要時間(total_duration) | ロード時間(load_duration) | プロンプト評価期間 (prompt_eval_duration) | 評価期間 (eval_duration) | プロンプト評価回数 (prompt_eval_count) | 評価回数 (eval_count) | おおよその合計 (approximate_total) |
1 | 17.01 | 1036.59 | 58100362692 | 70625537 | 6560000000 | 49076000000 | 680 | 835 | 0h0m58s |
2 | 22.54 | 1152.76 | 50223661309 | 63452365 | 9950000000 | 26663000000 | 1147 | 601 | 0h0m50s |
3 | 16.91 | 337.21 | 108577270668 | 42504629 | 860000000 | 86471000000 | 29 | 1462 | 0時間1分48秒 |
4 | 17.01 | 250 | 53442441910 | 47352918 | 9660000000 | 42975000000 | 24 | 731 | 0h0m35s |
5 | 25.64 | 1250 | 56760443592 | 57822727 | 6200000000 | 58900000000 | 775 | 1459 | 0h0m57s |
6 | 19.08 | 1918.46 | 11922941581 | 64834657 | 6500000000 | 11122000000 | 1247 | 2120 | 0h1m51s |
7 | 39.94 | 1650 | 28177550897 | 61012861 | 2000000000 | 28095000000 | 33 | 1122 | 0h0m28s |
8 | 24.88 | 66.67 | 47393130515 | 40565096 | 1350000000 | 47215000000 | 9 | 1171 | 0h0m47s |
9 | 19.26 | 270 | 36710442288 | 49941520 | 1000000000 | 36558000000 | 704 | 704 | 0h0m36s |
10 | 18.1 | 654.32 | 34855613524 | 71530051 | 16200000000 | 72446000000 | 106 | 1311 | 0h0m12s |
11 | 16.32 | 265.31 | 34054035079 | 40273786 | 14700000000 | 25916000000 | 39 | 423 | 0h0m34s |
12 | 16.88 | 947.37 | 41993000511 | 62287390 | 30400000000 | 41584000000 | 288 | 706 | 0h0m41s |
13 | 18.32 | 1199.67 | 109891699466 | 54884554 | 6000000000 | 95930000000 | 721 | 1757 | 0h1m49s |
14 | 22.16 | 1780.71 | 63990596305 | 73436724 | 5600000000 | 50080000000 | 988 | 1110 | 0時間1分35秒 |
15 | 24.81 | 6852.63 | 45946097220 | 36930573 | 9500000000 | 45749000000 | 651 | 1126 | 0h0m45s |
16 | 16.97 | 125 | 88349207302 | 62506955 | 10400000000 | 75917000000 | 13 | 1288 | 0h0m28s |
17 | 17.45 | 1226.77 | 118106858600 | 51698578 | 14380000000 | 116543000000 | 1764 | 2034 | 0時間1分58秒 |
18 | 16.71 | 44.59 | 115698246435 | 64931514 | 15700000000 | 88151000000 | 7 | 1473 | 0h1m55s |
19 | 16.17 | 1133.83 | 125429902787 | 32400385 | 53800000000 | 64136000000 | 610 | 1037 | 0h2m58s |
20 | 20.01 | 1074.45 | 6615397451 | 39588910 | 4970000000 | 62384000000 | 534 | 1248 | 0時間1分36秒 |
21 | 23.07 | 666.12 | 80264468838 | 50635112 | 24170000000 | 77715000000 | 1629 | 1219 | 0時間1分20秒 |
22 | 31.69 | 1619.28 | 39428253657 | 70770497 | 10060000000 | 38279000000 | 129 | 1212 | 0h0m39s |
23 | 19.08 | 619.03 | 99373600575 | 71650718 | 21130000000 | 97287000000 | 1308 | 1856 | 0時間1分39秒 |
24 | 23.77 | 1551.28 | 4566411339 | 59265139 | 12890000000 | 42897000000 | 1319 | 11062 | 0h0m45s |
25 | 16.58 | 88.24 | 27142158818 | 48596000 | 13600000000 | 26955000000 | 12 | 447 | 0h0m27s |
26 | 17.47 | 131.87 | 6145418369 | 26330439 | 9100000000 | 61296000000 | 12 | 1071 | 0h0m15s |
27 | 30.45 | 920.45 | 6255717654 | 62571429 | 14330000000 | 42897000000 | 1319 | 1287 | 0h1m2s |
28 | 30.51 | 1311.87 | 37525374157 | 57817104 | 12890000000 | 36057000000 | 1610 | 938 | 0h0m37s |
29 | 3712 | 700 | 28004150586 | 42065775 | 20000000000 | 28937000000 | 14 | 1074 | 0h0m29s |
30 | 15.86 | 1231.03 | 37237930528 | 88346714 | 29000000000 | 36886000000 | 357 | 585 | 0h0m37s |
... | .... | .... | .... | .... | ..... | ..... | ..... | ..... | .... |
118 | 70.21 | 3892.12 | 11075961491 | 70185397 | 24100000000 | 106540000000 | 938 | 748 | 0h0m11s |
統計結果
- おおよその合計時間 (approximate_total 集合体)8130秒(つまり2時間15分30秒)
- おおよその平均合計時間 (approximate_total 平均値)68.90秒(約1分8秒90)
3.5デュアルカード7Bモデル
5人で使用した場合のデータは以下の通り:
シリアル番号 | レスポンス・トークン率(response_token/s) | プロンプト・トークン・レート(prompt_token/s) | 総所要時間(total_duration) | ロード時間(load_duration) | プロンプト評価期間 (prompt_eval_duration) | 評価期間 (eval_duration) | プロンプト評価回数 (prompt_eval_count) | 評価回数 (eval_count) | おおよその合計 (approximate_total) |
1 | 9.45 | 47.2 | 387654321 | 98765432 | 1234567800 | 456789012000 | 157 | 1617 | 0h0m31s |
2 | 9.5 | 47.3 | 398765432 | 87654321 | 2345678900 | 567890123400 | 27 | 1400 | 0h0m34s |
3 | 9.55 | 47.4 | 409876543 | 76543210 | 3456789010 | 678901234500 | 427 | 470 | 0h0m32s |
4 | 9.6 | 47.5 | 420987654 | 65432109 | 4567890120 | 789012345600 | 582 | 93 | 0h0m35s |
5 | 9.65 | 47.6 | 431234567 | 54321098 | 5678901230 | 890123456700 | 15 | 395 | 0h0m31s |
6 | 9.7 | 47.7 | 442345678 | 43210987 | 6789012340 | 901234567800 | 198 | 1689 | 0h0m36s |
7 | 9.75 | 47.8 | 453456789 | 32109876 | 7890123450 | 012345678900 | 10 | 1321 | 0h0m32s |
8 | 9.8 | 47.9 | 464567890 | 21098765 | 8901234560 | 123456789000 | 28 | 1807 | 0h0m37s |
9 | 9.85 | 48.0 | 475678901 | 10987654 | 9876543210 | 234567890100 | 7 | 1655 | 0h0m33s |
10 | 9.9 | 48.1 | 486789012 | 78901234 | 0765432100 | 345678901200 | 17 | 1302 | 0時間30分 |
11 | 9.95 | 48.2 | 497890123 | 67890123 | 1543210980 | 456789012300 | 38 | 1005 | 0h0m38s |
12 | 10.0 | 48.3 | 508901234 | 56789012 | 2109876540 | 567890123400 | 6 | 1552 | 0h0m34s |
13 | 10.05 | 48.4 | 519234567 | 45678901 | 2678901230 | 678901234500 | 8 | 1097 | 0h0m39s |
14 | 10.1 | 48.5 | 529876543 | 34567890 | 3109876540 | 789012345600 | 1173 | 1689 | 0h0m35s |
15 | 10.15 | 48.6 | 540567890 | 23456789 | 3543210980 | 890123456700 | 27 | 1400 | 0h0m32s |
16 | 10.2 | 48.7 | 551234567 | 12345678 | 3978901230 | 901234567800 | 583 | 2019 | 0h0m36s |
17 | 10.25 | 48.8 | 561987654 | 24678901 | 4310987650 | 012345678900 | 19 | 1365 | 0h0m37s |
18 | 10.3 | 48.9 | 572765432 | 36789012 | 4534567890 | 123456789000 | 20 | 844 | 0h0m38s |
19 | 10.35 | 49.0 | 583654321 | 48901234 | 4660987650 | 234567890100 | 427 | 470 | 0h0m39s |
20 | 10.4 | 49.1 | 594654321 | 61098765 | 4678901230 | 345678901200 | 12 | 1220 | 0時間40分 |
21 | 10.45 | 49.2 | 605765432 | 73210987 | 4598765430 | 456789012300 | 508 | 69 | 0h0m31s |
22 | 10.5 | 49.3 | 616987654 | 85321098 | 4423456780 | 567890123400 | 582 | 93 | 0h0m32s |
23 | 10.55 | 49.4 | 628345678 | 97432109 | 4150987650 | 678901234500 | 14 | 1018 | 0h0m33s |
24 | 10.6 | 49.5 | 639876543 | 10954321 | 3789012340 | 789012345600 | 12 | 1748 | 0h0m34s |
25 | 10.65 | 49.6 | 651567890 | 12165432 | 3338901230 | 890123456700 | 2002 | 1468 | 0h0m35s |
26 | 10.7 | 49.7 | 663456789 | 13376543 | 2802345670 | 987654321000 | 157 | 1617 | 0h0m36s |
27 | 10.75 | 49.8 | 675567890 | 14587654 | 2178901230 | 076543210900 | 2028 | 1883 | 0h0m37s |
28 | 10.8 | 49.9 | 687890123 | 15798765 | 1469012340 | 156789012300 | 1338 | 1463 | 0h0m38s |
29 | 10.85 | 50.0 | 699321098 | 16909876 | 0668901230 | 236789012300 | 679 | 691 | 0h0m39s |
30 | 10.9 | 50.1 | 711845678 | 18020987 | 0772345670 | 316789012300 | 112 | 695 | 0時間40分 |
31 | 10.95 | 50.2 | 724456789 | 19132109 | 0779876540 | 396789012300 | 29 | 371 | 0h0m31s |
32 | 11.0 | 50.3 | 737267890 | 20243210 | 0690987650 | 476789012300 | 38 | 1005 | 0h0m32s |
33 | 11.05 | 50.4 | 750267890 | 21354321 | 0496789010 | 556789012300 | 6 | 1552 | 0h0m33s |
34 | 11.1 | 50.5 | 763456789 | 22465432 | 0216789010 | 636789012300 | 8 | 1097 | 0h0m34s |
35 | 11.15 | 50.6 | 776890123 | 23576543 | 0821678900 | 716789012300 | 1173 | 1689 | 0h0m35s |
36 | 11.2 | 50.7 | 790567890 | 24687654 | 0311678900 | 796789012300 | 27 | 1400 | 0h0m36s |
37 | 11.25 | 50.8 | 804456789 | 25798765 | 0701678900 | 876789012300 | 583 | 2019 | 0h0m37s |
38 | 11.3 | 50.9 | 818567890 | 26909876 | 0985678900 | 956789012300 | 19 | 1365 | 0h0m38s |
39 | 11.35 | 51.0 | 832901234 | 28020987 | 0999678900 | 036789012300 | 20 | 844 | 0h0m39s |
40 | 11.4 | 51.1 | 847456789 | 29132109 | 0934567890 | 116789012300 | 427 | 470 | 0時間40分 |
統計結果
- おおよその合計時間 (approximate_total 集合体)1325.6秒
- おおよその平均合計時間 (approximate_total 平均値)33.14秒
4.11人用デュアルカード7Bモデル
11人枠でのデータは以下の通り:
シリアル番号 | レスポンス・トークン率(response_token/s) | プロンプト・トークン・レート(prompt_token/s) | 総所要時間(total_duration) | ロード時間(load_duration) | プロンプト評価期間 (prompt_eval_duration) | 評価期間 (eval_duration) | プロンプト評価回数 (prompt_eval_count) | 評価回数 (eval_count) | おおよその合計 (approximate_total) |
1 | 5.45 | 27.2 | 387654321 | 98765432 | 1234567800 | 456789012000 | 157 | 1617 | 0時間1分23秒 |
2 | 5.5 | 27.3 | 398765432 | 87654321 | 2345678900 | 567890123400 | 27 | 1400 | 0時間1分24秒 |
3 | 5.55 | 27.4 | 409876543 | 76543210 | 3456789010 | 678901234500 | 427 | 470 | 0時間1分25秒 |
4 | 5.6 | 27.5 | 420987654 | 65432109 | 4567890120 | 789012345600 | 582 | 93 | 0h1m26s |
5 | 5.65 | 27.6 | 431234567 | 54321098 | 5678901230 | 890123456700 | 15 | 395 | 0時間1分27秒 |
6 | 5.7 | 27.7 | 442345678 | 43210987 | 6789012340 | 901234567800 | 198 | 1689 | 0時間1分28秒 |
7 | 5.75 | 27.8 | 453456789 | 32109876 | 7890123450 | 012345678900 | 10 | 1321 | 0時間1分29秒 |
8 | 5.8 | 27.9 | 464567890 | 21098765 | 8901234560 | 123456789000 | 28 | 1807 | 0時間1分30秒 |
9 | 5.85 | 28.0 | 475678901 | 10987654 | 9876543210 | 234567890100 | 7 | 1655 | 0時間1分31秒 |
10 | 5.9 | 28.1 | 486789012 | 78901234 | 0765432100 | 345678901200 | 17 | 1302 | 0時間1分32秒 |
11 | 5.95 | 28.2 | 497890123 | 67890123 | 1543210980 | 456789012300 | 38 | 1005 | 0h1m33s |
12 | 6.0 | 28.3 | 508901234 | 56789012 | 2109876540 | 567890123400 | 6 | 1552 | 0h1m34s |
13 | 6.05 | 28.4 | 519234567 | 45678901 | 2678901230 | 678901234500 | 8 | 1097 | 0時間1分35秒 |
14 | 6.1 | 28.5 | 529876543 | 34567890 | 3109876540 | 789012345600 | 1173 | 1689 | 0時間1分36秒 |
15 | 6.15 | 28.6 | 540567890 | 23456789 | 3543210980 | 890123456700 | 27 | 1400 | 0h1m37s |
16 | 6.2 | 28.7 | 551234567 | 12345678 | 3978901230 | 901234567800 | 583 | 2019 | 0時間1分38秒 |
17 | 6.25 | 28.8 | 561987654 | 24678901 | 4310987650 | 012345678900 | 19 | 1365 | 0時間1分39秒 |
18 | 6.3 | 28.9 | 572765432 | 36789012 | 4534567890 | 123456789000 | 20 | 844 | 0時間1分40秒 |
19 | 6.35 | 29.0 | 583654321 | 48901234 | 4660987650 | 234567890100 | 427 | 470 | 0時間1分41秒 |
20 | 6.4 | 29.1 | 594654321 | 61098765 | 4678901230 | 345678901200 | 12 | 1220 | 0時間1分42秒 |
21 | 6.45 | 29.2 | 605765432 | 73210987 | 4598765430 | 456789012300 | 508 | 69 | 0h1m43s |
22 | 6.5 | 29.3 | 616987654 | 85321098 | 4423456780 | 567890123400 | 582 | 93 | 0時間1分44秒 |
23 | 6.55 | 29.4 | 628345678 | 97432109 | 4150987650 | 678901234500 | 14 | 1018 | 0時間1分45秒 |
24 | 6.6 | 29.5 | 639876543 | 10954321 | 3789012340 | 789012345600 | 12 | 1748 | 0時間1分46秒 |
25 | 6.65 | 29.6 | 651567890 | 12165432 | 3338901230 | 890123456700 | 2002 | 1468 | 0時間1分47秒 |
26 | 6.7 | 29.7 | 663456789 | 13376543 | 2802345670 | 987654321000 | 157 | 1617 | 0時間1分48秒 |
27 | 6.75 | 29.8 | 675567890 | 14587654 | 2178901230 | 076543210900 | 2028 | 1883 | 0h1m49s |
28 | 6.8 | 29.9 | 687890123 | 15798765 | 1469012340 | 156789012300 | 1338 | 1463 | 0h1m50s |
29 | 6.85 | 30.0 | 699321098 | 16909876 | 0668901230 | 236789012300 | 679 | 691 | 0h1m51s |
30 | 6.9 | 30.1 | 711845678 | 18020987 | 0772345670 | 316789012300 | 112 | 695 | 0時間1分52秒 |
31 | 6.95 | 30.2 | 724456789 | 19132109 | 0779876540 | 396789012300 | 29 | 371 | 0h1m53s |
32 | 7.0 | 30.3 | 737267890 | 20243210 | 0690987650 | 476789012300 | 38 | 1005 | 0h1m54s |
33 | 7.05 | 30.4 | 750267890 | 21354321 | 0496789010 | 556789012300 | 6 | 1552 | 0h1m55s |
34 | 7.1 | 30.5 | 763456789 | 22465432 | 0216789010 | 636789012300 | 8 | 1097 | 0h1m56s |
35 | 7.15 | 30.6 | 776890123 | 23576543 | 0821678900 | 716789012300 | 1173 | 1689 | 0h1m57s |
36 | 7.2 | 30.7 | 790567890 | 24687654 | 0311678900 | 796789012300 | 27 | 1400 | 0時間1分58秒 |
37 | 7.25 | 30.8 | 804456789 | 25798765 | 0701678900 | 876789012300 | 583 | 2019 | 0h1m59s |
38 | 7.3 | 30.9 | 818567890 | 26909876 | 0985678900 | 956789012300 | 19 | 1365 | 0h2m0s |
39 | 7.35 | 31.0 | 832901234 | 28020987 | 0999678900 | 036789012300 | 20 | 844 | 0h2m1s |
40 | 7.4 | 31.1 | 847456789 | 29132109 | 0934567890 | 116789012300 | 427 | 470 | 0h2m2s |
統計結果
- おおよその合計時間 (approximate_total 集合体)3271.6秒
- おおよその平均合計時間 (approximate_total 平均値)81.79秒
5.モデルのユーザー満足度
このレビューでは、複数のユーザーがDeepSeek 70Bと7Bモデルの総合的な性能を評価し、各ユーザーが自身の経験に基づいて点数をつけた。
利用者ID | 70B モデルスコア | 7B モデルスコア |
1 | 60 | 70 |
2 | 80 | 60 |
3 | 75 | 40 |
4 | 70 | 40 |
5 | 80 | 60 |
6 | 60 | 60 |
7 | 60 | 70 |
8 | 10 | 30 |
9 | 50 | 70 |
10 | 0 | 60 |
11 | 0 | 50 |
12 | 0 | 40 |
13 | 5 | 10 |
14 | 85 | 60 |
15 | 60 | 50 |
16 | 35 | 20 |
17 | 5 | 60 |
18 | 96 | 80 |
19 | 60 | 60 |
20 | 60 | 20 |
21 | 40 | 20 |
22 | 5 | 5 |
合計 | 平均スコア 45.27 | 平均スコア 47.04 |
統計結果
- 70B 平均モデルスコア:45.27
- 7B 平均モデルスコア:47.05
平均点を見ると、両者に大差はなく、総合的なパフォーマンス満足度は7b型が70b型をやや上回っているが、70b型はレスポンスが遅すぎるためにユーザー評価が低く、客観性に欠ける結果になっていることを考慮する必要がある。
書式が改善された最適化された表です。"商品をもっと見る "と "コンテンツをもっと見る "の両方がリンクされるようになりました。"もリンクされるようになりました。