這篇文章將為大家詳細講解有關如何利用LINQ進行分組統(tǒng)計,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
創(chuàng)新互聯(lián)主要從事成都網站設計、做網站、網頁設計、企業(yè)做網站、公司建網站等業(yè)務。立足成都服務海西,十多年網站建設經驗,價格優(yōu)惠、服務專業(yè),歡迎來電咨詢建站服務:18982081108
讓我們來生成要統(tǒng)計的數(shù)據,如下所示:
IEnumerable> GetTuples(int n) { var tuples = new Tuple [n]; var rand = new Random(); for (int k = 1, i = 0; i < n; i++) { var r = rand.Next(n); k += (r >= n - 3) ? 2 : ((r >= n - 9) ? 1 : 0); tuples[i] = new Tuple (k, rand.NextDouble()); } return tuples; }
該方法生成 n 項已經排好序的數(shù)據。
現(xiàn)在,讓我們來按關鍵字分組,并統(tǒng)計每組的個數(shù)和平均值。
首先,使用 C# 的 foreach 循環(huán),如下所示:
IEnumerable> ForEach(IEnumerable > tuples) { var result = new List >(); var count = 0; var sum = 0.0; int? key = null; foreach (var v in tuples) { if (key != v.Item1) { if (key != null) result.Add(new Tuple (key.Value, count, sum / count)); sum = count = 0; key = v.Item1; } count++; sum += v.Item2; } if (key != null) result.Add(new Tuple (key.Value, count, sum / count)); return result; }
這種方法有個***的缺點就是在 foreach 循環(huán)結束之后還要進行一次統(tǒng)計,聞到了代碼的“壞味道”。
那么,就讓我們來重構吧,這次,使用迭代器進行循環(huán):
IEnumerable> Iterate(IEnumerable > tuples) { var result = new List >(); var count = 0; var sum = 0.0; int? key = null; for (var iter = tuples.GetEnumerator(); ; count++, sum += iter.Current.Item2) { var hasValue = iter.MoveNext(); if (!hasValue || key != iter.Current.Item1) { if (key != null) result.Add(new Tuple (key.Value, count, sum / count)); if (!hasValue) break; sum = count = 0; key = iter.Current.Item1; } } return result; }
這樣,就消滅了“壞味道”。
注意,以上兩種方法都假設輸入數(shù)據已經排好序。如若不然,就要先對輸入數(shù)據進行一次排序。
***,如果使用LINQ的話,還可以更簡單:
IEnumerable> Linq(IEnumerable > tuples) { var result = new List >(); var q = from k in tuples group k by k.Item1; foreach (var g in q) result.Add(new Tuple (g.Key, g.Count(), g.Average(v => v.Item2))); return result; }
要注意LINQ 方法無論是運行時間還是占用的內存都更大。
我們來看看 Main 方法:
static void Main(string[] args) { try { new Program().Run(Console.Out, int.Parse(args[0])); } catch (Exception ex) { Console.WriteLine(ex); } } void Run(TextWriter writer, int n) { var tuples = GetTuples(n * 1024 * 1024); Write("ForEach", writer, ForEach(tuples)); Write("Iterate", writer, Iterate(tuples)); Write(" Linq ", writer, Linq(tuples)); }
其中的 Write 方法如下所示:
void Write(string title, TextWriter writer, IEnumerable> tuples) { writer.WriteLine("==========> " + title + " <============"); writer.WriteLine("Key ------Count Average----------"); var count = 0; var sum = 0.0; foreach (var t in tuples) { writer.WriteLine("{0,3} {1,11:N0} {2}", t.Item1, t.Item2, t.Item3); count += t.Item2; sum += t.Item2 * t.Item3; } writer.WriteLine("--- ----------- -----------------"); writer.WriteLine("{0,3} {1,11:N0} {2}", tuples.Count(), count, sum / count); writer.WriteLine(); }
***,這個程序的輸出如下所示:
==========> ForEach <============
Key ------Count Average----------
1 10,476 0.492122426354162
2 1,633,289 0.499917991099794
3 981,345 0.500446307804579
5 1,542,377 0.500567888024527
6 478,158 0.499376479287702
8 62,325 0.501552373474687
9 1,463,104 0.500270067230854
11 802,680 0.500518684820775
13 367,798 0.499572390413821
14 492,947 0.500767958524
16 2,403,053 0.500023199420802
17 248,208 0.499988049057847
--- ----------- -----------------
12 10,485,760 0.50018897689056
==========> Iterate <============
Key ------Count Average----------
1 10,476 0.492122426354162
2 1,633,289 0.499917991099794
3 981,345 0.500446307804579
5 1,542,377 0.500567888024527
6 478,158 0.499376479287702
8 62,325 0.501552373474687
9 1,463,104 0.500270067230854
11 802,680 0.500518684820775
13 367,798 0.499572390413821
14 492,947 0.500767958524
16 2,403,053 0.500023199420802
17 248,208 0.499988049057847
--- ----------- -----------------
12 10,485,760 0.50018897689056
==========> Linq <============
Key ------Count Average----------
1 10,476 0.492122426354162
2 1,633,289 0.499917991099794
3 981,345 0.500446307804579
5 1,542,377 0.500567888024527
6 478,158 0.499376479287702
8 62,325 0.501552373474687
9 1,463,104 0.500270067230854
11 802,680 0.500518684820775
13 367,798 0.499572390413821
14 492,947 0.500767958524
16 2,403,053 0.500023199420802
17 248,208 0.499988049057847
--- ----------- -----------------
12 10,485,760 0.50018897689056
這個程序中用到的 Tuple 類如下所示:
class Tuple{ public T1 Item1 { get; private set; } public T2 Item2 { get; private set; } public Tuple(T1 item1, T2 item2) { Item1 = item1; Item2 = item2; } } class Tuple : Tuple { public T3 Item3 { get; private set; } public Tuple(T1 item1, T2 item2, T3 item3) : base(item1, item2) { Item3 = item3; } }
其實 .NET Framework 4.0 Base Class Library 中已經有 Tuple 類了。
關于“如何利用LINQ進行分組統(tǒng)計”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。