ローカル DeepSeek モデルに必要な構成と、各構成の実行時スコア

I. 研究の結論

1.全体的な結論

この研究の結果は、現在ローカルで見つけることができる高いコンピューティング能力条件下で、DeepSeek モデルの基本バージョンを実行することは、依然として大きな課題に直面していることを示している。具体的には、構築コストが高すぎ、継続的な質疑応答や開発支援のような一般的なシナリオをサポートするには、パフォーマンスと品質の面でまだ十分ではありません。

ある製品に適用するために、DeepSeek モデルのベースバージョンに基づいて特殊なモデルをトレーニン グする場合は、同時実行性、適時性などの観点から、アプリケーションシナリオの技術要件を注意深く 検討する必要があります。ベースモデルのサイズと製品の目標演算量の関係を合理的に評価し、製品のコストと効果のバラン スを取る必要があります。

現在のローカルハードウェア環境下での DeepSeek モデルの動作には多くの制約があるが、全く未開拓というわけではない。ビデオメモリの大容量化やより効率的なハードウェアアーキテ クチャの採用等、ハードウェアコストの適切な上昇を前提とし、同時に 7B のような小型モデルをベースとした蒸留学習等の技術的手段を強化することで、モデルク イズの質を向上させ、よりローカルアプリケーションのニーズに応えることが可能となる。また、既存のハードウェア条件下でモデルの性能をさらに向上させるために、モデルのアルゴリズムやパラメータのデバッグを最適化する方法を深く探求することも可能である。

deepseek

2.異なるローカルモデルのパフォーマンス

DeepSeek R1 は、DeepSeek の Web サイトからモデルをローカルに展開するための最小構成要件に基 づき、利用可能な優れたハードウェア(NVIDIA A100 80G グラフィックスメモリ 2 枚など)と組み合わ せて最大 70b のモデル実行をサポートできましたが、671b のフルモデルを実行することはでき ませんでした。

1.5bは効果がなく、70bと7bを中心に比較検証した。

また、我々は最初に70bモデルの応答速度が遅すぎることを発見したシングルカードのテストを実施し、デュアルカードのテストは、単一のデュアルカードの理論的な性能差(推論性能の速度に異なる算術の影響の同じモデルは、理論的には品質に影響を与えませんが、単純な検証も理論的なシナリオに沿っている)、したがって、我々はデュアルカードの実験環境は、唯一の検証の広い範囲の7bモデルを使用しています。

7bモデリング性能:5人フル装備テストでは、7bモデルは最初のQ&Aでは比較的速く回答した(デュアルカードでは35秒近く、シングルカードでは70秒近く)。回答内容の構成と質は中程度であったが、いくつかの複雑な推論的質問や連続的なフォローアップ質問をした後、文脈の成長により、7bモデルは、回答速度は安定していたものの、支離滅裂な、でっち上げの、思いつきの回答が見られるようになった。

70bモデリング性能:5人フル負荷テストでは、70bモデルは同じ質問に対する最初の回答が非常に遅かった(シングルカードでは7分以上、デュアルカードでは単純な検証のみで詳細なテストは行っていない)。回答内容は、構成、レイアウト、質ともに7bモデルよりは少しましでしたが、7bモデルの回答には遠く及ばず、文脈が長くなるにつれ(7bモデルより長い)、70bモデルも回答の質の低さ、論理の混乱、作り話といった同じ現象が見られました。特に、70bの応答時間は利用可能なハードウェアに対して長すぎるため、ユーザーエクスペリエンスが悪く、品質スコアに深刻な影響を与えている。

最後に、ユーザーの評価データを通じて、7bと70bの両モデルは応答内容の質という点では不合格であったが、7bモデルは比較的応答が速いため、ユーザーの満足度はやや高かった。

3.ローカル70bモデルと公式ウェブモデルの比較

70bの模範解答は平均的なクオリティ。

70b モデルに対する回答の質については、いくつかのテストを実施しました。同じ質問を、ローカルに配置された DeepSeek-R1:70b モデルと、オンラインの DeepSeek 公式 Web サイト (つまり、完全な DeepSeek-R1 モデル) に対して行いました。

まず、反応速度に違いがある。ローカルモデルの70bでは約70秒(1人テスト)、オフィシャルウェブ側では約30秒(1人テスト)。

二つ目は、両者の回答内容の質の違いである。70bモデルでは、通常の知識クイズ問題では単純な回答が、推理問題では複雑な問題でも不正解が出ることがあるのに対し、公式フルブラッド版では、単純な知識クイズでも複雑な推理問題でも、より実戦に近い詳細で具体的な質の回答が出る。

4.異なるハードウェアの下での搭載ユーザー数の評価

シングルカードA100:7bモデルで約3~4人、70bモデルで約1~2人のユーザーを搭載するのが理想的。

デュアルSIM A100:7bモデルでは、理想的なユーザー数は8~10人程度。

さらに、デュアル・カード・モードでの応答の質は、シングル・カード・モードの7bモデルと基本的に同じである。伝送されたユーザー数やレスポンスなどの指標の改善は、基本的に線形、すなわち1+1≈2である。

5.500人の同時ユーザーをホストするためのハードウェア・コストの見積もり

最低でも7bモデルのハードウェア導入コストは約300万ドルと推定される。

最初の応答時間(70秒)を最大許容キューイング時間としてください。同社のR&Dに約500人を使用するには、少なくとも100ウェイ並行計算をサポートする必要があり、クラスタモードのための複数のサーバーアーキテクチャである必要があり、ユニットとして4カードA100を想定すると、単一のユニットは、20ウェイ並行処理をサポートすることができますし、5台のサーバーにクラスタを形成する必要があり、関連するハードウェアのコストは約300万元の最小値である必要があります。

まとめると、DeepSeek-R1:7bのローカルモデルをより多くの人が同時に使用することをサポートする必要があり、ハードウェアのコストが比較的高く、システムの安定した運用を確保するためには、ネットワーク帯域幅やサーバーの性能など、その他の要因も実際のアプリケーションで考慮する必要があります。

同時に、ユーザーの増加やピーク時のモデルアップ需要に対応するため、システムの信頼性と拡張性を確保するために、ハードウェアの冗長性を適切に高める(例えば、10%~20%のハードウェアリソースを増やす)必要があり、実際の投資コストは300万人民元よりはるかに大きくなる可能性がある。

II.実験環境とモダリティ

1.DeepSeekリリースノート:

DeepSeekのR1推論モデルのバージョンの選択については、公式サイトの最小構成要件によると

4ビットの量子化ユニットを持つollamaを使用しているが、ビデオメモリ≒参加者数/2=335G≒80*4であるため、671Bバージョンのモデルを展開するには、少なくとも5台のA100が必要となる。

そのため、この用途のハードウェア環境では、最大でもA100 80Gのグラフィックカード2枚のみで、この条件下ではDeepSeek - R1の70Bモデルの最大動作にしか対応できない。

2.実験環境
  1. モデリング DeepSeek-r1:7bモデル、DeepSeek-r1:70bモデル
  2. サーバNF5280M5
  3. ディスプレイカードNVIDIA A100 80GB PCIe *2、シングルカードとデュアルカードに分かれています。
3.試験方法
  1. シングルカード試験 7bモデルと70bモデルの平均レスポンスタイムとGPU負荷を同時5ユーザーで測定し、テスターはレスポンスの質に基づいてモデルのパフォーマンスに対する満足度を評価した。
  2. デュアルSIMテスト 評価7bは、同時に5人で使用し、徐々にユーザー数を増やしながら、GPUの負荷とレスポンスタイムの消費を観察しました。

III.データ概要

これは1時間で行われたクイズのテストデータの統計である。

ハードウェア環境 モデリング 利用者数(人) 平均応答時間(秒) GPU負荷 ユーザー満足度(100点)
シングルカード A100 7b 5 68.90 100% 47.05
シングルカード A100 70b 5 461.61 100% 45.27
デュアルSIM A100 7b 5 33.14 90%
デュアルSIM A100 7b 11 81.79 100%

データ分析

1.シングルカードとデュアルカードの性能比較
  1. 7bモデルを5人で使用した場合のシングルカードとデュアルカードのデータから、デュアルカードの平均レスポンスタイムはシングルカードの約2倍(シングルカード68.90秒、デュアルカード33.14秒)であるが、GPU負荷に関してはデュアルカードは全負荷限界に達しておらず、10%程度のマージンが残っている。このことから、同じユーザー数・機種を扱った場合、レスポンスタイムは短縮されるものの、デュアルカードによる大幅な性能向上は見込めないことがわかる。
  2. デュアルカードのユーザー数が11人まで増加し続けると、平均回答時間は約80秒に上昇し、7bモデルを5人で使用した場合のシングルカードでの回答時間(68.90秒)に近くなり、GPUはフルキャパシティに達する。このことは、デュアルカードの能力が11人程度で飽和に近いことを示している。

2.モデルサイズが性能に与える影響

シングルカード環境では、同じユーザー数(5)の場合、70b モデルは 7b モデルと比較して平均レスポンスタイムが大幅に増加し(461.61 秒対 68.90 秒)、両方の GPU がフルロードの限界に達しています。これは、モデルのサイズがレスポンスタイムに大きく影響することを示唆しており、同じユーザーリクエストをシングルカードのハードウェアで処理する場合、より大きなモデルはより時間がかかり、より大きなパフォーマンスプレッシャーにさらされます。

3.モデルの応答満足度の比較

シングルカード環境では、参加者に7bモデルと70bモデルそれぞれの解答の質と回答速度を考えてもらい、モデルの総合的な質を採点した。 100点満点で、70bモデルは45.27点、7bモデルは47.05点となり、ともに不合格となった。なお、デュアルカード環境については、7bモデルをそのまま使用したため、回答内容に変化はなく、成績の採点には関与しなかった。

平均点を見ると、両者にほとんど差はなく、7B型が70B型よりもレスポンスが速いため、性能の満足度ではやや上回っている。

V. 関連する実験データ

1.シングルカード70bモデル

測定データは以下の通り:

シリアル番号 レスポンス・トークン率(response_token/s) プロンプト・トークン・レート(prompt_token/s) 総所要時間(total_duration) ロード時間(load_duration) プロンプト評価期間 (prompt_eval_duration) 評価期間 (eval_duration) プロンプト評価回数 (prompt_eval_count) 評価回数 (eval_count) おおよその合計 (approximate_total)
1 7.4 355.2 4283113421231 64926183 4420000000 218494000000 157 1617 0h7m8s
2 7.48 81.33 1045634640765 68951189 3320000000 187176000000 27 1400 0時間17分25秒
3 8.04 344.35 24894132815 71000796 12400000000 8426000000 427 470 0時間4分48秒
4 7.5 337.59 591143315288 45644958 1724000000 12407000000 582 93 0時間9分51秒
5 9.91 29.7 404229221982 47558712 505000000 39875000000 15 395 0時間5分40秒
6 14.33 232.67 130453080347 1068651783 8510000000 117870000000 198 1689 0時間2分10秒
7 6.72 18.76 95210741192 48216793 5330000000 198665000000 10 1321 0時間15分52秒
8 8.23 79.55 98536075497 48032930 3520000000 219607000000 28 1807 0時間16分35秒
9 8.57 15.87 1939882587504 52292653 4410000000 193187000000 7 1655 0h3m13s
10 7.78 92.9 203144306266 51738331 1830000000 167322000000 17 1302 0h3m23s
11 8.13 117.29 239838846247 43393536 3240000000 234391000000 38 1005 0時間3分52秒
12 7.53 15.87 5212125785230 46219772 3070000000 193187000000 6 1552 0時間4分41秒
13 7.22 37.38 472712581796 56530817 2140000000 151867000000 8 1097 0時間7分52秒
14 6.76 355.78 786198638097 52828335 3297000000 250036000000 1173 1689 0時間13分6秒
15 7.48 81.33 1045634640765 68951189 3320000000 187176000000 27 1400 0時間17分25秒
16 7.46 328.71 1074760952244 55115370 1809000000 270544000000 583 2019 0時間17分54秒
17 7.55 67.62 1035246489195 43186618 2810000000 180891000000 19 1365 0時間17分15秒
18 8.2 69.2 231120109216 65393535 2890000000 102891000000 20 844 0h3m51s
19 8.04 344.35 24894132815 71000796 12400000000 8426000000 427 470 0時間4分48秒
20 7.46 531 298843367796 35052474 2260000000 163617000000 12 1220 0時間4分58秒
21 8.12 367.32 160780214661 29093937 13830000000 85020000000 508 69 0h2m46s
22 7.5 337.59 591143315288 45644958 1724000000 12407000000 582 93 0時間9分51秒
23 8.71 47.46 8892981852348 55347279 2950000000 116917000000 14 1018 0時間14分52秒
24 7.57 40.54 372006145019 57666960 2960000000 230779000000 12 1748 0時間6分12秒
25 7.29 312.13 394296371542 52036868 6414000000 201349000000 2002 1468 0時間6分34秒
26 7.4 355.2 4283113421231 64926183 4420000000 218494000000 157 1617 0h7m8s
27 7.45 343.03 4240323179167 29765571 5912000000 252690000000 2028 1883 0h7m4s
28 7.39 347.62 343393037822 445458914 3849000000 198053000000 1338 1463 0時間5分43秒
29 7.68 355.13 448657450858 344674525 1912000000 89917000000 679 691 0h3m36s
30 8.65 223.11 367343951946 44474014 5020000000 80331000000 112 695 0h6m7s
31 8.87 159.34 46850899401 80106631 1820000000 41840000000 29 371 0h0m46s

統計結果

  • おおよその合計時間 (approximate_total 集合体)14,310秒(つまり3時間55分10秒)
  • おおよその平均合計時間 (approximate_total 平均値)461.61秒(約7分41秒)

2.シングルカード7bモデル

シリアル番号 レスポンス・トークン率(response_token/s) プロンプト・トークン・レート(prompt_token/s) 総所要時間(total_duration) ロード時間(load_duration) プロンプト評価期間 (prompt_eval_duration) 評価期間 (eval_duration) プロンプト評価回数 (prompt_eval_count) 評価回数 (eval_count) おおよその合計 (approximate_total)
1 17.01 1036.59 58100362692 70625537 6560000000 49076000000 680 835 0h0m58s
2 22.54 1152.76 50223661309 63452365 9950000000 26663000000 1147 601 0h0m50s
3 16.91 337.21 108577270668 42504629 860000000 86471000000 29 1462 0時間1分48秒
4 17.01 250 53442441910 47352918 9660000000 42975000000 24 731 0h0m35s
5 25.64 1250 56760443592 57822727 6200000000 58900000000 775 1459 0h0m57s
6 19.08 1918.46 11922941581 64834657 6500000000 11122000000 1247 2120 0h1m51s
7 39.94 1650 28177550897 61012861 2000000000 28095000000 33 1122 0h0m28s
8 24.88 66.67 47393130515 40565096 1350000000 47215000000 9 1171 0h0m47s
9 19.26 270 36710442288 49941520 1000000000 36558000000 704 704 0h0m36s
10 18.1 654.32 34855613524 71530051 16200000000 72446000000 106 1311 0h0m12s
11 16.32 265.31 34054035079 40273786 14700000000 25916000000 39 423 0h0m34s
12 16.88 947.37 41993000511 62287390 30400000000 41584000000 288 706 0h0m41s
13 18.32 1199.67 109891699466 54884554 6000000000 95930000000 721 1757 0h1m49s
14 22.16 1780.71 63990596305 73436724 5600000000 50080000000 988 1110 0時間1分35秒
15 24.81 6852.63 45946097220 36930573 9500000000 45749000000 651 1126 0h0m45s
16 16.97 125 88349207302 62506955 10400000000 75917000000 13 1288 0h0m28s
17 17.45 1226.77 118106858600 51698578 14380000000 116543000000 1764 2034 0時間1分58秒
18 16.71 44.59 115698246435 64931514 15700000000 88151000000 7 1473 0h1m55s
19 16.17 1133.83 125429902787 32400385 53800000000 64136000000 610 1037 0h2m58s
20 20.01 1074.45 6615397451 39588910 4970000000 62384000000 534 1248 0時間1分36秒
21 23.07 666.12 80264468838 50635112 24170000000 77715000000 1629 1219 0時間1分20秒
22 31.69 1619.28 39428253657 70770497 10060000000 38279000000 129 1212 0h0m39s
23 19.08 619.03 99373600575 71650718 21130000000 97287000000 1308 1856 0時間1分39秒
24 23.77 1551.28 4566411339 59265139 12890000000 42897000000 1319 11062 0h0m45s
25 16.58 88.24 27142158818 48596000 13600000000 26955000000 12 447 0h0m27s
26 17.47 131.87 6145418369 26330439 9100000000 61296000000 12 1071 0h0m15s
27 30.45 920.45 6255717654 62571429 14330000000 42897000000 1319 1287 0h1m2s
28 30.51 1311.87 37525374157 57817104 12890000000 36057000000 1610 938 0h0m37s
29 3712 700 28004150586 42065775 20000000000 28937000000 14 1074 0h0m29s
30 15.86 1231.03 37237930528 88346714 29000000000 36886000000 357 585 0h0m37s
... .... .... .... .... ..... ..... ..... ..... ....
118 70.21 3892.12 11075961491 70185397 24100000000 106540000000 938 748 0h0m11s

統計結果

  • おおよその合計時間 (approximate_total 集合体)8130秒(つまり2時間15分30秒)
  • おおよその平均合計時間 (approximate_total 平均値)68.90秒(約1分8秒90)
3.5デュアルカード7Bモデル

5人で使用した場合のデータは以下の通り:

シリアル番号 レスポンス・トークン率(response_token/s) プロンプト・トークン・レート(prompt_token/s) 総所要時間(total_duration) ロード時間(load_duration) プロンプト評価期間 (prompt_eval_duration) 評価期間 (eval_duration) プロンプト評価回数 (prompt_eval_count) 評価回数 (eval_count) おおよその合計 (approximate_total)
1 9.45 47.2 387654321 98765432 1234567800 456789012000 157 1617 0h0m31s
2 9.5 47.3 398765432 87654321 2345678900 567890123400 27 1400 0h0m34s
3 9.55 47.4 409876543 76543210 3456789010 678901234500 427 470 0h0m32s
4 9.6 47.5 420987654 65432109 4567890120 789012345600 582 93 0h0m35s
5 9.65 47.6 431234567 54321098 5678901230 890123456700 15 395 0h0m31s
6 9.7 47.7 442345678 43210987 6789012340 901234567800 198 1689 0h0m36s
7 9.75 47.8 453456789 32109876 7890123450 012345678900 10 1321 0h0m32s
8 9.8 47.9 464567890 21098765 8901234560 123456789000 28 1807 0h0m37s
9 9.85 48.0 475678901 10987654 9876543210 234567890100 7 1655 0h0m33s
10 9.9 48.1 486789012 78901234 0765432100 345678901200 17 1302 0時間30分
11 9.95 48.2 497890123 67890123 1543210980 456789012300 38 1005 0h0m38s
12 10.0 48.3 508901234 56789012 2109876540 567890123400 6 1552 0h0m34s
13 10.05 48.4 519234567 45678901 2678901230 678901234500 8 1097 0h0m39s
14 10.1 48.5 529876543 34567890 3109876540 789012345600 1173 1689 0h0m35s
15 10.15 48.6 540567890 23456789 3543210980 890123456700 27 1400 0h0m32s
16 10.2 48.7 551234567 12345678 3978901230 901234567800 583 2019 0h0m36s
17 10.25 48.8 561987654 24678901 4310987650 012345678900 19 1365 0h0m37s
18 10.3 48.9 572765432 36789012 4534567890 123456789000 20 844 0h0m38s
19 10.35 49.0 583654321 48901234 4660987650 234567890100 427 470 0h0m39s
20 10.4 49.1 594654321 61098765 4678901230 345678901200 12 1220 0時間40分
21 10.45 49.2 605765432 73210987 4598765430 456789012300 508 69 0h0m31s
22 10.5 49.3 616987654 85321098 4423456780 567890123400 582 93 0h0m32s
23 10.55 49.4 628345678 97432109 4150987650 678901234500 14 1018 0h0m33s
24 10.6 49.5 639876543 10954321 3789012340 789012345600 12 1748 0h0m34s
25 10.65 49.6 651567890 12165432 3338901230 890123456700 2002 1468 0h0m35s
26 10.7 49.7 663456789 13376543 2802345670 987654321000 157 1617 0h0m36s
27 10.75 49.8 675567890 14587654 2178901230 076543210900 2028 1883 0h0m37s
28 10.8 49.9 687890123 15798765 1469012340 156789012300 1338 1463 0h0m38s
29 10.85 50.0 699321098 16909876 0668901230 236789012300 679 691 0h0m39s
30 10.9 50.1 711845678 18020987 0772345670 316789012300 112 695 0時間40分
31 10.95 50.2 724456789 19132109 0779876540 396789012300 29 371 0h0m31s
32 11.0 50.3 737267890 20243210 0690987650 476789012300 38 1005 0h0m32s
33 11.05 50.4 750267890 21354321 0496789010 556789012300 6 1552 0h0m33s
34 11.1 50.5 763456789 22465432 0216789010 636789012300 8 1097 0h0m34s
35 11.15 50.6 776890123 23576543 0821678900 716789012300 1173 1689 0h0m35s
36 11.2 50.7 790567890 24687654 0311678900 796789012300 27 1400 0h0m36s
37 11.25 50.8 804456789 25798765 0701678900 876789012300 583 2019 0h0m37s
38 11.3 50.9 818567890 26909876 0985678900 956789012300 19 1365 0h0m38s
39 11.35 51.0 832901234 28020987 0999678900 036789012300 20 844 0h0m39s
40 11.4 51.1 847456789 29132109 0934567890 116789012300 427 470 0時間40分

統計結果

  • おおよその合計時間 (approximate_total 集合体)1325.6秒
  • おおよその平均合計時間 (approximate_total 平均値)33.14秒
4.11人用デュアルカード7Bモデル

11人枠でのデータは以下の通り:

シリアル番号 レスポンス・トークン率(response_token/s) プロンプト・トークン・レート(prompt_token/s) 総所要時間(total_duration) ロード時間(load_duration) プロンプト評価期間 (prompt_eval_duration) 評価期間 (eval_duration) プロンプト評価回数 (prompt_eval_count) 評価回数 (eval_count) おおよその合計 (approximate_total)
1 5.45 27.2 387654321 98765432 1234567800 456789012000 157 1617 0時間1分23秒
2 5.5 27.3 398765432 87654321 2345678900 567890123400 27 1400 0時間1分24秒
3 5.55 27.4 409876543 76543210 3456789010 678901234500 427 470 0時間1分25秒
4 5.6 27.5 420987654 65432109 4567890120 789012345600 582 93 0h1m26s
5 5.65 27.6 431234567 54321098 5678901230 890123456700 15 395 0時間1分27秒
6 5.7 27.7 442345678 43210987 6789012340 901234567800 198 1689 0時間1分28秒
7 5.75 27.8 453456789 32109876 7890123450 012345678900 10 1321 0時間1分29秒
8 5.8 27.9 464567890 21098765 8901234560 123456789000 28 1807 0時間1分30秒
9 5.85 28.0 475678901 10987654 9876543210 234567890100 7 1655 0時間1分31秒
10 5.9 28.1 486789012 78901234 0765432100 345678901200 17 1302 0時間1分32秒
11 5.95 28.2 497890123 67890123 1543210980 456789012300 38 1005 0h1m33s
12 6.0 28.3 508901234 56789012 2109876540 567890123400 6 1552 0h1m34s
13 6.05 28.4 519234567 45678901 2678901230 678901234500 8 1097 0時間1分35秒
14 6.1 28.5 529876543 34567890 3109876540 789012345600 1173 1689 0時間1分36秒
15 6.15 28.6 540567890 23456789 3543210980 890123456700 27 1400 0h1m37s
16 6.2 28.7 551234567 12345678 3978901230 901234567800 583 2019 0時間1分38秒
17 6.25 28.8 561987654 24678901 4310987650 012345678900 19 1365 0時間1分39秒
18 6.3 28.9 572765432 36789012 4534567890 123456789000 20 844 0時間1分40秒
19 6.35 29.0 583654321 48901234 4660987650 234567890100 427 470 0時間1分41秒
20 6.4 29.1 594654321 61098765 4678901230 345678901200 12 1220 0時間1分42秒
21 6.45 29.2 605765432 73210987 4598765430 456789012300 508 69 0h1m43s
22 6.5 29.3 616987654 85321098 4423456780 567890123400 582 93 0時間1分44秒
23 6.55 29.4 628345678 97432109 4150987650 678901234500 14 1018 0時間1分45秒
24 6.6 29.5 639876543 10954321 3789012340 789012345600 12 1748 0時間1分46秒
25 6.65 29.6 651567890 12165432 3338901230 890123456700 2002 1468 0時間1分47秒
26 6.7 29.7 663456789 13376543 2802345670 987654321000 157 1617 0時間1分48秒
27 6.75 29.8 675567890 14587654 2178901230 076543210900 2028 1883 0h1m49s
28 6.8 29.9 687890123 15798765 1469012340 156789012300 1338 1463 0h1m50s
29 6.85 30.0 699321098 16909876 0668901230 236789012300 679 691 0h1m51s
30 6.9 30.1 711845678 18020987 0772345670 316789012300 112 695 0時間1分52秒
31 6.95 30.2 724456789 19132109 0779876540 396789012300 29 371 0h1m53s
32 7.0 30.3 737267890 20243210 0690987650 476789012300 38 1005 0h1m54s
33 7.05 30.4 750267890 21354321 0496789010 556789012300 6 1552 0h1m55s
34 7.1 30.5 763456789 22465432 0216789010 636789012300 8 1097 0h1m56s
35 7.15 30.6 776890123 23576543 0821678900 716789012300 1173 1689 0h1m57s
36 7.2 30.7 790567890 24687654 0311678900 796789012300 27 1400 0時間1分58秒
37 7.25 30.8 804456789 25798765 0701678900 876789012300 583 2019 0h1m59s
38 7.3 30.9 818567890 26909876 0985678900 956789012300 19 1365 0h2m0s
39 7.35 31.0 832901234 28020987 0999678900 036789012300 20 844 0h2m1s
40 7.4 31.1 847456789 29132109 0934567890 116789012300 427 470 0h2m2s

統計結果

  • おおよその合計時間 (approximate_total 集合体)3271.6秒
  • おおよその平均合計時間 (approximate_total 平均値)81.79秒
5.モデルのユーザー満足度

このレビューでは、複数のユーザーがDeepSeek 70Bと7Bモデルの総合的な性能を評価し、各ユーザーが自身の経験に基づいて点数をつけた。

利用者ID 70B モデルスコア 7B モデルスコア
1 60 70
2 80 60
3 75 40
4 70 40
5 80 60
6 60 60
7 60 70
8 10 30
9 50 70
10 0 60
11 0 50
12 0 40
13 5 10
14 85 60
15 60 50
16 35 20
17 5 60
18 96 80
19 60 60
20 60 20
21 40 20
22 5 5
合計 平均スコア 45.27 平均スコア 47.04

統計結果

  • 70B 平均モデルスコア:45.27
  • 7B 平均モデルスコア:47.05

平均点を見ると、両者に大差はなく、総合的なパフォーマンス満足度は7b型が70b型をやや上回っているが、70b型はレスポンスが遅すぎるためにユーザー評価が低く、客観性に欠ける結果になっていることを考慮する必要がある。
書式が改善された最適化された表です。"商品をもっと見る "と "コンテンツをもっと見る "の両方がリンクされるようになりました。"もリンクされるようになりました。

 

その他の製品については

詳細はこちら

シャツAI - 貫通する知性 AIGCビッグモデル:工学と科学の二大革命の時代を切り開く - Penetrating Intelligence
クロードとGPTの1:1復元 公式サイト - AI Cloud Native ライブマッチアプリ グローバルHDスポーツ観戦プレーヤー(推奨) - Blueshirt Technology
公式APIに基づくトランジットサービス - GPTMeta API GPTでの質問の仕方を教えてください。 - 知識

 

広告スペース

公式APIに基づくトランジット・エージェント・サービス

オープンと共有の時代において、OpenAIは人工知能の革命をリードしています。この度、GPT-4-ALL、GPT-4-multimodal、GPT-4-gizmo-*など、OpenAIの全モデルを完全にサポートし、さらに様々な自家製ビッグモデルもサポートしたことを世界に発表します。最もエキサイティングなのは、より強力で影響力のあるGPT-4oを世に送り出したことです!

サイトナビゲーション

図頭
サードパーティとのドッキング
コンソール
使用方法
オンライン・モニタリング

お問い合わせ

公众号二维码

公開番号

企业合作二维码

協力 Wechat