Điểm chuẩn: nó là gì? Nó để làm gì lịch sử, loại và lời khuyên

Mục lục:

Lịch sử
Các loại điểm chuẩn
Cân nhắc khi điểm chuẩn
Kết luận

Điểm chuẩn là một phần thiết yếu trong phân tích phần cứng hàng ngày của chúng tôi, chúng cho phép chúng tôi cung cấp cho bạn một phép đo so sánh khoa học giữa các thành phần khác nhau như CPU, card đồ họa, đơn vị lưu trữ, v.v. Hôm nay chúng tôi sẽ dành một số dòng cho lịch sử của nó , cho các loại của nó, cách chúng hoạt động, những gì chúng đo lường, các biện pháp phổ biến nhất và chúng tôi cũng sẽ cung cấp cho bạn một số mẹo về cách thực hiện chúng và những gì chúng ta nên tin tưởng.

Những gì chúng ta biết ngày nay trong thế giới PC hoặc di động là điểm chuẩn là các kỹ thuật được thừa hưởng từ môi trường công nghiệp đã cho phép, kể từ khi bắt đầu cuộc cách mạng này, việc ra quyết định dựa trên dữ liệu so sánh trong môi trường được kiểm soát.

Thế giới điện toán hiện đại áp dụng các kỹ thuật này cho hầu hết mọi lĩnh vực khác nhau và người dùng gia đình cũng đã áp dụng chúng như một cách đáng tin cậy để tìm hiểu về hiệu suất và khả năng của hệ thống của chúng tôi cũng như một điểm thông tin quan trọng khi nói đến để đưa ra quyết định quan trọng, chẳng hạn như mua máy tính mới , điện thoại di động, card đồ họa, v.v.

Hôm nay chúng ta sẽ nói về lịch sử của điểm chuẩn PC, các loại điểm chuẩn tồn tại và thành phần nào trong hệ thống của chúng tôi phù hợp hơn cho loại thử nghiệm này không chỉ hiệu năng.

Chỉ số nội dung

Lịch sử

Hệ thống đo lường hoặc đo lường áp dụng một môi trường được kiểm soát và các phép đo có thể nhận biết được có thể so sánh về mặt khoa học và có thể kiểm chứng và đã cùng tồn tại với thế giới của máy tính kể từ khi nó tồn tại. Các tiêu chuẩn, như vậy, đã được dân chủ hóa đến mức một phần bản chất cơ bản của nó đã bị mất, đó là nó có thể được kiểm tra và kiểm chứng bởi các bên thứ ba. Bây giờ chúng tôi sử dụng nó nhiều hơn như một so sánh nhanh về hiệu suất, nhưng khả năng truy nguyên tính chính xác của nó bởi các bên thứ ba chắc chắn đã bị mất.

Các phương pháp điểm chuẩn cổ điển nhất luôn đề cập đến khả năng tính toán của CPU của hệ thống, mặc dù trong thời gian gần đây, nó đã thay đổi giữa các thành phần khác nhau, vì chúng đã đạt được sự ưu tiên và tầm quan trọng trong máy tính.

Hai đơn vị đo lường cổ điển nhất vẫn được áp dụng là Dhstallones và Whetstones. Cả hai đã trở thành nền tảng của tất cả các tiêu chuẩn tổng hợp mà chúng ta biết ngày nay.

Lâu đời nhất là Whetstones (một địa phương ở Vương quốc Anh, nơi đặt bộ phận năng lượng nguyên tử của công ty điện lực nhà nước Vương quốc Anh) và Dhstallone đến sau đó chơi với tên đầu tiên (ướt và khô).

Cái đầu tiên được thiết kế vào những năm 70 và cái thứ hai là từ những năm 80 và cả hai đều là nền tảng của hiệu suất so sánh mà chúng ta đã có trong những năm liên tiếp. Whetstones, đơn giản hóa, cung cấp một cái nhìn sâu sắc về sức mạnh tính toán của bộ xử lý trong các hoạt động điểm nổi, hoạt động với số lượng lớn số thập phân.

Dhstallone là đối tác của nó vì nó được dành riêng cho các hướng dẫn cơ bản không có số thập phân, cả hai đã đưa ra một bức tranh rõ ràng về hiệu suất của bộ xử lý từ hai cách tiếp cận hoàn toàn khác nhau, nhưng bổ sung. Whetstones và Dhstallone bắt nguồn từ hai khái niệm mà chúng ta sử dụng phổ biến hơn nhiều hiện nay là MIPS và FLOP.

Sau khi các phép đo này xuất hiện các phép đo khác như FLOP (Số học dấu phẩy động - số học dấu phẩy động), ở một mức độ lớn, giờ đây quan trọng hơn trong máy tính so với trước đây vì nó là nền tảng của tính toán tiên tiến trong nhiều kỹ thuật hiện đại. chẳng hạn như thuật toán trí tuệ nhân tạo, thuật toán y tế, dự báo thời tiết, logic mờ, mã hóa, v.v.

LINPACK được phát triển bởi kỹ sư Jack Dongarra vào những năm 1980 và tiếp tục được sử dụng ngày nay để đo khả năng tính toán dấu phẩy động của tất cả các loại hệ thống. Hiện tại có các phiên bản được tối ưu hóa bởi kiến trúc, nhà sản xuất CPU, v.v.

FLOPS điền vào các bài viết của chúng tôi về card đồ họa (chắc chắn độ chính xác đơn hoặc đôi nghe có vẻ quen thuộc), bộ xử lý và là cơ sở để tính toán yêu cầu năng lượng và phát triển phần cứng cho bất kỳ siêu máy tính nào đang hoạt động hoặc phát triển.

FLOP ngày nay là đơn vị đo lường hiệu suất cần thiết nhất trong ngành, nhưng nó luôn được kết hợp với MIPS (Hàng triệu hướng dẫn mỗi giây), đây là một biện pháp đo lường thú vị, vì nó cung cấp cho chúng tôi số lượng hướng dẫn Số học cơ bản mà bộ xử lý có thể thực hiện mỗi giây, nhưng điều đó phụ thuộc nhiều vào kiến trúc của bộ xử lý (ARM, RISC, x86, v.v.) và ngôn ngữ lập trình so với các đơn vị đo lường khác.

Khi hiệu suất đã tăng lên, số nhân đã xảy ra. Bây giờ chúng tôi đo hiệu suất của CPU gia đình trong GIPS và GFLOPS. Các cơ sở vẫn giữ nguyên, hoạt động số học cổ điển. Sisoft Sandra tiếp tục cung cấp cho chúng tôi loại đo lường này trong một số điểm chuẩn tổng hợp của nó.

MIPS cũng đã được chuyển xuống CPU nhiều hơn như là một yếu tố cổ điển và FLOP đã mở rộng sang các lĩnh vực thịnh vượng khác như công suất xử lý hoặc tính toán chung của các bộ xử lý trước rất hướng đến các tác vụ cụ thể như GPU mà tất cả chúng ta đều gắn trên bộ xử lý của mình hoặc trên thẻ mở rộng chuyên dụng của chúng tôi.

Đối với các khái niệm cơ bản này, thời gian đã được thêm các đơn vị đo lường mới nhiều hoặc quan trọng hơn các đơn vị đo lường trong một máy tính hoặc siêu máy tính hiện đại. Truyền dữ liệu là một trong những biện pháp đã trở nên rất quan trọng và hiện được đo bằng IOP (hoạt động đầu vào và đầu ra mỗi giây) và cả ở các hình thức khác như các biện pháp lưu trữ MB / GB / TB so với thời gian cần thiết chuyển từ điểm này sang điểm khác (MBps - Megabyte mỗi giây).

AS-SSD có thể đo hiệu suất của đĩa cứng tính bằng MBps hoặc IOP.

Hiện tại chúng tôi cũng sử dụng biện pháp chuyển giao, theo các bội số khác nhau của nó, như một cách diễn giải tốc độ truyền thông tin giữa hai điểm khi phát ra thông tin nhất định mà chúng tôi thực sự phải tạo thêm một chút thông tin. Điều này phụ thuộc vào giao thức được sử dụng để chuyển thông tin.

Một ví dụ rõ ràng và chúng tôi sử dụng rất nhiều, là trong giao diện PCI Express. Theo giao thức này, cứ 8 bit thông tin mà chúng ta muốn di chuyển (0 hoặc 1 giây), chúng ta phải tạo ra 10 bit thông tin vì thông tin bổ sung đó là để kiểm soát truyền thông được gửi để sửa lỗi, tính toàn vẹn dữ liệu, v.v.

Các giao thức nổi tiếng khác cũng giới thiệu thông tin thực tế về mất dữ liệu này là IP, giao thức bạn đang sử dụng để đọc bài viết này và điều đó làm cho kết nối 300MT / s của bạn thực sự cung cấp tốc độ thấp hơn 300mbps một chút.

Do đó, chúng tôi sử dụng Gigatransfer hoặc chuyển khi chúng tôi đề cập đến thông tin thô được gửi bởi giao diện chứ không phải thông tin thực sự được xử lý trong máy thu. Một bus dữ liệu PCI Express 3.0 8GT / s thực sự đang gửi 6.4GBps thông tin cho mỗi dòng được kết nối giữa các điểm. Chuyển giao đã trở nên rất quan trọng với việc tích hợp giao thức PCI Express trong tất cả các xe buýt chính của máy tính gia đình và chuyên nghiệp.

Trong thời gian gần đây, chúng tôi cũng bắt đầu kết hợp các biện pháp như một cách liên quan đến sức mạnh xử lý với các yếu tố rất quan trọng khác trong điện toán hiện đại, với mức tiêu thụ là một trong những biện pháp được đưa ra như một thang đo so sánh giữa hiệu suất của hai hệ thống. Hiệu suất năng lượng ngày nay quan trọng hơn nhiều so với công suất xử lý và do đó dễ dàng nhận thấy các điểm chuẩn so sánh công suất quá trình theo công suất tiêu thụ của phần tử trong phép đo.

Trên thực tế, một trong những danh sách siêu máy tính tuyệt vời không đề cập nhiều đến sức mạnh tổng thể của máy tính trong số tất cả các nút tính toán của nó mà là sự phát triển của sức mạnh đó dựa trên công suất hoặc năng lượng tiêu thụ của toàn hệ thống. Danh sách Green500 (FLOPS mỗi watt - FLOPS mỗi watt) là một ví dụ rõ ràng về mức tiêu thụ hiện nay là cơ bản đối với bất kỳ tiêu chuẩn tự tôn nào, mặc dù không nghi ngờ gì nữa, tất cả chúng ta tiếp tục xem xét kỹ danh sách TOP500 không có yếu tố điều hòa này.

Các loại điểm chuẩn

Mặc dù chúng ta có thể nói về nhiều gia đình hoặc loại điểm chuẩn hơn, tôi sẽ đơn giản hóa danh sách trong hai lớp phổ biến nhất của những nhóm gần nhất với tất cả chúng ta với tư cách là người dùng cao cấp hoặc ít hơn.

Một mặt, chúng tôi có các điểm chuẩn tổng hợp mà phần lớn là các tiêu chuẩn cung cấp cho chúng tôi các biện pháp mà chúng tôi đã nói trước đây. Điểm chuẩn tổng hợp là các chương trình thực hiện các kiểm tra có kiểm soát với mã chương trình ổn định hơn hoặc ít hơn được định hướng cho một nền tảng và kiến trúc cụ thể. Chúng là các chương trình thực hiện các thử nghiệm rất cụ thể có thể tích hợp một hoặc nhiều thành phần của chúng tôi, nhưng trong đó thử nghiệm hoặc thử nghiệm tương tự luôn được thực hiện mà không có thay đổi.

Kết xuất hình ảnh luôn là một phương pháp tốt để biết hiệu năng của CPU trong một hệ thống hiện đại vì đây là một nhiệm vụ đòi hỏi khắt khe. Cinebench R15 cũng có một số thử nghiệm, một cho GPU và hai cho CPU, trong đó chúng ta có thể biết hiệu suất của các hệ thống có nhiều lõi và xử lý luồng.

Họ cung cấp một môi trường thử nghiệm được kiểm soát, trong đó không có thay đổi nào ngoại trừ các phiên bản và nơi những thay đổi này được ghi lại đúng cách để người dùng biết phiên bản nào có thể được so sánh với nhau. Các loại chương trình này có thể kiểm tra riêng các hệ thống con khác nhau của máy tính của chúng tôi, với các đoạn mã khác hoặc điểm chuẩn cụ thể để thực hiện một loại thử nghiệm nhất định hoặc kết hợp có thể bị ảnh hưởng bởi hiệu suất của một, hai hoặc nhiều thành phần hệ thống. Điểm chuẩn được tích hợp trong một trò chơi hoặc các chương trình như Cinebench, Sisoft Sandra, SuperPI, 3DMark,… là những ví dụ rõ ràng về điểm chuẩn tổng hợp.

Các điểm chuẩn tổng hợp khác mà chúng ta không nên nhầm lẫn với điểm chuẩn thực là những điểm chuẩn mô phỏng việc thực thi chương trình thực hoặc thực thi tập lệnh hành động trong chương trình thực, chúng cũng được tổng hợp do không có sự ngẫu nhiên trong thử nghiệm, PC Mark là một ví dụ rõ ràng về chương trình điểm chuẩn tổng hợp mà chúng ta có thể nhầm lẫn với một điểm chuẩn thực sự.

Điểm chuẩn thực tế là một phương pháp thử nghiệm rất khác vì nó chấp nhận tính ngẫu nhiên của việc sử dụng một chương trình để đo lường hiệu suất của nó. Người chơi đã quen với việc thực hiện loại điểm chuẩn hoặc kiểm tra hiệu suất này khi chúng tôi điều chỉnh các thông số chất lượng của trò chơi theo khả năng của phần cứng của chúng tôi.

Đo lường hiệu suất của một trò chơi trong khi bạn chơi là một điểm chuẩn thực sự.

Khi bạn mở FPS mà trò chơi đang đưa ra và cố gắng đạt được 60FPS mong muốn liên tục thì họ đang thực hiện một điểm chuẩn thực sự. Điều tương tự cũng có thể được ngoại suy cho bất kỳ loại chương trình nào khác và nếu bạn là nhà phát triển, khi bạn tối ưu hóa mã chương trình của mình, thì bạn cũng đang thực hiện các bài kiểm tra điểm chuẩn thực sự trong đó thay đổi là mã của bạn hoặc cách thực hiện nó trên nền tảng của phần cứng ổn định hoặc thay đổi.

Cả hai loại điểm chuẩn đều quan trọng, loại thứ nhất cho phép chúng ta so sánh hệ thống của mình với hệ thống khác trong môi trường được kiểm soát và loại thứ hai là cách tối ưu hóa hoạt động của chúng tôi, trong đó hai yếu tố quan trọng cũng được thêm vào, tính ngẫu nhiên trong thực thi và yếu tố con người. Cả hai yếu tố cung cấp một quan điểm bổ sung về hiệu suất của thành phần hoặc các thành phần mà chúng tôi muốn kiểm tra.

Cân nhắc khi điểm chuẩn

Để một điểm chuẩn là hữu ích và hiệu quả, chúng ta phải tính đến một số yếu tố thực sự quan trọng. So sánh giữa các nền tảng và kiến trúc khác nhau đưa ra một yếu tố không chắc chắn quan trọng, đó là lý do tại sao loại điểm chuẩn này cung cấp cho bạn khả năng so sánh điện thoại di động iOS với máy tính Windows x86, để đưa ra một ví dụ, bạn phải lấy chúng bằng nhíp vì nó không chỉ thay đổi nhân hệ điều hành, nhưng kiến trúc bộ xử lý rất khác nhau. Các nhà phát triển của loại điểm chuẩn này (ví dụ: Geekbench) giới thiệu các yếu tố hiệu chỉnh giữa các phiên bản khác nhau mà khó có thể kiểm soát được.

Do đó, chìa khóa đầu tiên để điểm chuẩn có thể so sánh giữa các phần cứng khác nhau là hệ sinh thái thử nghiệm tương tự nhất có thể với nền tảng điểm chuẩn, hệ điều hành, trình điều khiển và phiên bản phần mềm. Chắc chắn sẽ có những yếu tố ở đây mà chúng ta không thể kiểm soát đồng nhất hóa, như bộ điều khiển đồ họa nếu chúng ta kiểm tra đồ họa AMD với đồ họa Nvidia, nhưng phần còn lại chúng ta phải cố gắng làm cho nó ổn định nhất có thể. Trong trường hợp này, chúng tôi cũng sẽ bao gồm phần cứng, vì để so sánh card đồ họa, điều của bạn là sử dụng cùng một hệ điều hành, cùng bộ xử lý, cùng bộ nhớ và tất cả các tham số vận hành, giữ chúng như nhau, bao gồm các thông số về chất lượng, độ phân giải và kiểm tra trong điểm chuẩn. Hệ sinh thái thử nghiệm của chúng tôi càng ổn định thì kết quả của chúng tôi sẽ càng đáng tin cậy và có thể so sánh.

Chúng tôi khuyên bạn nên đọc Làm thế nào để biết bộ xử lý của tôi có bị nghẽn cổ chai không?

Một điều khác mà chúng ta phải tính đến là các bài kiểm tra điểm chuẩn thường có yếu tố căng thẳng trên phần cứng mà chúng ta sẽ kiểm tra và thường khiến phần cứng này gặp phải các tình huống thường không xảy ra trong sử dụng bình thường của hệ thống. Mọi điểm chuẩn mà chúng tôi xóa khỏi ổ cứng, card đồ họa hoặc bộ xử lý của chúng tôi đều đưa chúng vào các tình huống có thể gây nguy hiểm cho phần cứng, vì vậy chúng tôi phải thiết lập các biện pháp thích hợp để điểm căng thẳng không trở thành điểm gãy hoặc cũng trong một yếu tố làm giảm hiệu suất do nhiều thành phần có hệ thống bảo vệ mà chúng làm giảm hiệu suất của chúng trong trường hợp, ví dụ, nhiệt độ ngoài phạm vi sử dụng của chúng. Làm mát đầy đủ, thời gian nghỉ giữa các lần kiểm tra, cho ăn đúng các thành phần được kiểm tra… mọi thứ phải ở trong một tình huống lý tưởng để thử nghiệm chạy trơn tru.

Mặt khác, chúng tôi cũng sử dụng chính xác loại điểm chuẩn này để khiến hệ thống bị căng thẳng để thấy sự ổn định của nó trong loại tình huống này, đó là một cách khác để áp dụng điểm chuẩn vì nó không chỉ tìm cách biết hiệu suất mà còn hệ thống ổn định và thậm chí nhiều hơn, nếu hệ thống hoạt động như bình thường trong những tình huống căng thẳng này.

Kết luận

Đối với những người trong chúng tôi kiểm tra phần cứng máy tính một cách chuyên nghiệp, điểm chuẩn là một công cụ làm việc và nhờ có nó, người dùng có một cách khoa học và có thể kiểm chứng để so sánh hoặc biết hiệu suất của máy tính tiếp theo của chúng tôi trong mỗi hệ thống con của nó một cách chính xác so sánh với các công cụ được sử dụng ở cấp độ công nghiệp.

Một bảng thử nghiệm, giống như bảng bạn nhìn thấy trong hình ảnh, tìm cách chuẩn hóa chính xác phương pháp thử nghiệm, sao cho điểm chuẩn so sánh là đáng tin cậy nhất có thể và có thể kiểm tra được khi đưa ra các biến thể sửa đổi kết quả.

Nhưng giống như bất kỳ thử nghiệm nào trong phòng thí nghiệm, và để nó đáng tin cậy, phải có các điều kiện phù hợp để thực hiện và thậm chí còn hơn thế để nó có thể so sánh giữa các hệ thống khác nhau.

Hôm nay chúng tôi đã nói với bạn một chút về lịch sử của loại chương trình này, các loại khác nhau, cách thức hoạt động và cách nhận thông tin đáng tin cậy từ họ. Chúng rất hữu ích, nhưng đối với tôi chúng chỉ là một thông tin cần lưu ý và tôi sẽ luôn đặt nó phía sau trải nghiệm cá nhân và thử nghiệm tích cực với các chương trình thực mà chúng ta sẽ sử dụng hàng ngày.

Một điểm chuẩn là tốt để đưa dữ liệu hiệu suất tối thiểu vào quy trình quyết định của chúng tôi, nhưng chúng không nên xác định các quyết định đó và, như một mẹo cuối cùng, tránh các điểm chuẩn tổng hợp tuyên bố có thể so sánh hiệu suất giữa các kiến trúc, hệ điều hành, v.v.

Mục lục:

Lịch sử

Các loại điểm chuẩn

Cân nhắc khi điểm chuẩn

Kết luận

Lựa chọn của người biên tập