Hardware 版 (精华区)

发信人: muyu (驱动), 信区: Hardware
标  题: 【GeForce256 性能大剖析(上)】
发信站: 紫 丁 香 (Thu Mar  9 17:08:21 2000), 站内信件


【GeForce256 性能大剖析(上)】
------------------------------------------------------
超越摩尔定律
-
--- 在摩尔定律的魔咒下,处理器中的晶体管数正以每18个月
增加一倍的速度,飞快的精进著。而今显示芯片的研发正陷入
比摩尔定律还恐怖的速度,正以每6~9个月为一个周期,快速
的往前挺进,而且进步的幅度还不只一倍。
--
    显示芯片的进化起步虽晚,尤其由2D迈入3D之后,发展的
速度比处理器还要惊人
    想想只不过是去年初的事,笔者的一个朋友花2千多块买了
Voodoo2子卡,打起Game来真是爽,让他臭屁了好一阵子。但好
景不常,如今那块Voodoo2跑一些比较炫的3D游戏(如Quake3),
你所得到的回应却是画面跳格、特效不够、记忆体不足。实在
让人无法忍受.
----
   新时代显示芯片
    从目前台面上已知最新的显示芯片,nVidia的GeForce256
(原代号NV10)与S3 Savage2000(原代号GX4)的架构来看,我们
不难看出显示芯片的发展已经迈入转型的阶段,套用nVidia所
定义的,往后的显示芯片应该可以称为GPU
(Graphics Processing Unit)。为什么叫做GPU呢?简单的说,
就是显示芯片做了更多以往原本需要靠CPU来运算的动作。而
显示芯片可以代劳的就是Transform(几何形变)与Lighting
(光源处理)。
-----
    原本需要靠CPU处理的Transform与Lighting,在往后的新显示
芯片将是内建的标准之一
    从上表大家可以看到3D呈像的基本执行方式就是由上到下的执
行管线。而显示芯片从早期只能负责呈像阶段最后Rendering(图素
描绘)的工作,进步到可以执行Triangle Setup(三角形设定)与
Clipping(剔除遮蔽)。3D显示芯片的设计公司均在这两大阶段花了
很多功夫去摸索,才达到现在显示卡的水准。
    可是现在技术上却出现了瓶颈,想要在这两个阶段里加快处理
速度,除了多增加几条管线来处理外,似乎没有其他方法了。这一
点我们可以从TNT2演进到GeForce256的架构上看到技术无法突破的
瓶颈。
    难道在现有的架构中,不能想出一些方法吗?ATi就想出了比较
特别的做法,ATi的Rage Fury MAXX这张显示卡,运用了两颗
Rage128 Pro芯片,分别处理奇数张与偶数张的画面,来增加3D呈像
的速度,ATi称之为「Multiple ASIC Technology」。但是在想法上
还是不脱增加管线的概念。
     采用两颗ATi Rage128 Pro做成的Rage Fury MAXX
    不过这种做法,并不能算是新世代的显示芯片,因为
Rage Fury MAXX不是一颗新的3D显示芯片。所以在此前提下,nVidia
与S3不约而同的将矛头指向整个3D呈像的过程,将Transform与
Lighting纳入3D显示芯片的处理范围。而这种做法有很多的好处,除
了能增加3D呈像的速度外,还可以减轻处理器的负担,让CPU去执行
其他必要的工作,比方说玩Game时敌方的人工智慧(AI)、逻辑运算等。
如此一来系统的整体效能就会被提升。
CPU如果减轻了负担,就可以处理更多其他的事,进而增加整体效能
   nVidia GeForce256
    前面说了那么多,无非只是想介绍未来新的显示芯片的方向,而
具备T&L架构显示芯片,相信应该会是主流,而目前GeForce256与
Savage2000,则是新一代显示芯片中,最早出现在市面上的。不过因
为S3并购Diamond,不知道S3的Savage2000是否还会外售,所以状况
不明。另外还有3dfx传说中的Voodoo4。相信新一代显示芯片的王位
之争,马上就要开打了。
    其实我注意GeForce256已经有一段时间了,大概在今年初,就已经
有风声出来,说nVidia会有一个代号NV10的产品,将会具备4组
Rendering Engine,这真是令人震撼的消息,因为当时没有人可以做出
这样的产品,随著时间NV10的资料也渐渐的在网络上流传著,不过产品
未上市之前,一切都不能断定,再加上TNT2才刚上市不久,nVidia有能
力这么快就推出新产品吗?所有的怀疑直到正式产品名称确定为
GeForce256,才算是尘埃落定。
    但在10月份,就见到了创新的GeForce256,实在不敢相信,创新的
研发速度居然如此之快,不过此时的驱动程序都还在修Bug的阶段,效能
与稳定度都还必须要加强,如果要测试还不是时机,创新保证下一个版本
的驱动程序会有显著的进步。所以笔者决定等待nVidia释出新版后再测试。
    差不多在10月11、12号左右,创新与丽台的新版驱动程序陆续出来了,
而在10/13号在ELSA网站上还看到了ELSA的ERAZOR X,德国制造的
GeForce256,与创新与丽台的那两张的线路有很大的不同,绝对不是
nVidia的原厂公板设计。不过很可惜ELSA的ERAZOR X必须要等到11月上旬
才会上市,无法参加本次的测试,不然一次三张显示卡来车拼,多过瘾啊。
    ELSA的所推出采用GeForce256芯片的ERAZOR X
    刚刚有提到公板的问题,这次创新与丽台所送测的Geforce256,
都是公板的设计,两者不论在线路布局与原件的配置上,可以说是一模
一样(连风扇都是AddA的)。唯一的差别只在于丽台具备了TV OUT的功能
与DVI接头。所以可以预期的,两张显示卡的效能差异可能不大。不过
据丽台表示,近期还将会推出一款非公板设计的GeForce256,有SDRAM
与DDR两种版本。
----
    nVidia的Roadmap真的是每9个月推出一款新芯片
    nVidia的研发速度,已经不是你我可以想像的(难道为了彻底实践
摩尔定律吗!?),GeForce256才推出没有多久,该公司预计在2000年
春天,又将公布代号NV20的最新显示芯片,nVidia在高端显示芯片的
动作频频(绿色框里都是下一代高阶显示芯片),几乎快要一统高端芯
片市场。而且我猜想,nVidia或许也会像TNT2一样,利用Geforce256
衍生出不同的产品线,吃下不同阶层的市场。
----
    在下一面的文章里,笔者将先为大家分析Geforce256的架构,
与这些架构到底能带来多少的效能,最后才会进行产品的实测。有兴趣
的网友请接下去看吧!
---
   全新的技术
---
    nVidia GeForce256的规格架构确实是让人耳目一新,有许多的
新的观念,比方说管状环境贴图等必须一一来介绍,但笔者还是还是
先列出规格表,让大家了解一下GeForce256的基本规格。
nVidia GeForce256 规格表

核心构架 256-bit graphics architecture
显存 最大128MB (SDR/DDR)
核心速度 120MHz
显存频率 166MHz
AGP Type 2X / 4X
RAMDAC 350MHz
三角形生成速率 15 Million triangles/sec
点描绘速率 480Mpixel/sec
显存速率 2.6Gbytes/sec(SDRAM)
新增3D硬件构架 Transform and Lighting (T&L)绘图引擎
 256-bit QuadPipe 图象描绘引擎
 Cube environment mapping(管狀环境贴图)
制作工艺 0.22u / 23million晶体管数 / 548pin BGA
 
Geforce256与TNT2之比较

  RIVA TNT2 GeForce256
着色引擎 128-bit 256-bit
点描绘速率 300Mpixel/sec 480Mpixel/sec
三角形生成速率 9 Million  15 Million
着色管线数量 2 4
计划绘图引擎数量 0 2
是否支持T&L No Yes
向量混合技术 No Yes
管狀环境贴图 No Yes
快速写入AGP 4X No Yes
是否支持HDTV No Yes
    从nVidia替GeForce256写的文宣资料当中,有几个地方是他们一直
强调的,那就是GeForce256是全世界第一颗GPU、QuadPipe Rendering
Engine、Cube environment mapping、AGP 4X with Fast Writes及第
一个支援HDTV的显示芯片。
什么是T&L?
    从上一页的解说中,大家应该都可以了解显示芯片加入T&L的好处。
那到底Transform与Lighting是什么意思呢?这就必须牵扯电脑3D绘图
的理论,在整个呈像的过程里分为物理运算、几何形变、三角设定与
图素描绘等4个阶段。
3D呈像的4个阶段
    在物理运算中,电脑透过数学去描绘物体的方式,模拟现实世界
各种物体的物理特徵及事件的发生过程。而电脑此时必须创造一个全
360度的立体场景或物体座标世界,让使用者使用景点观看的方式观
看物体,以及物体间彼此的相互关系。这当中所有的过程,必须要靠
大量的浮点运算来完成,所以这个部分只能交由处理器来做。
    而在几何形变中,电脑必须透过多套运算,将上一个过程中算出
的真实世界座标转化为电脑萤幕上能呈现方式(这个转换的过程就是
Transform)。此时还必须考虑到所谓的使用者视角(或Camera),考虑
到视角的同时,为求真实感,就必须考虑到光源的处理(Lighting)与
剔除遮蔽(Clipping)。如此一来就已经可以在萤幕上画出3D的立体框
架,接下去的动作就只需要处理如何将骨架上色、贴材质等的动作
(简单的说就是替骨架穿衣服)。

将真实世界的空间转为萤幕上所能呈现的3D虚拟世界
    T&L的动作其实蛮吃CPU的资源,所以当显示芯片能够帮处理器
代劳的时候,自然处理器就有闲暇的功夫去处理别的事情了。不过
这项技术还在起步阶段,相信再经过一段时间的研究开发,还有不
少的进步空间。
什么是QuadPipe
    在GeForce256芯片核心架构中,除了新增Transform Engine与
Lighting Engine外,也整合了两颗TNT2(Setup Engine、Rendering
 Engine与两组图素管线,是原本TNT2中的架构),形成
4(Twin-texel X 2 = 4) X 4(四组引擎)的核心架构,而这个4X4的
架构,nVidia给他取了一个名字叫做「QuadPipe Rendering Engine」。
而GeForce256的256-bit的核心引擎也源自于此,4组64bit的图素
管线(6X64=256)。
GeForce256整合了两颗TNT2的核心
此架构nVidia称之为QuadPipe
    在QuadPipe Rendering Engine中,四组图素管线,完全独立运作,
可以将一个材质在同一个时间里,处理四个图素点,或是两个材质,
分由两组图素管线去处理,nVidia宣称Geforce256在此架构下,图素
描绘的速度可高达480Mpix/sec。
什么是Cube Environment Mapping?
    在Matrox G400上有所谓的Bump Mapping,而nVidia则在GeForce256
上推出了Cube Environment Mapping与Matrox相互较劲,不过这两个技术
想要表现的效果不太相同,但都是针对环境贴图所做的努力。
    Bump Mapping著重在不规则的物体曲面贴图,而Cube Environment
 Mapping则是针对环境周遭事物的反射做对应贴图。由于
Cube Environment Mapping使用六片材质套用在模型上,所以比起单
使用一张材质的状况,更能正确的显示出现实的环境。
环境贴图最简单的原理示意图
Cube Environment Mapping使用六片材质组合而成
将六片材质套用于模型上
AGP 4X 快速写入技术
    GeForce256还有一个比较具有特色的地方,就是具备
Fast Writes的AGP 4X,从下面两张示意图来看(nVidia以Intel 820为例),
传统的AGP运作模式是当CPU需要写入资料到显示卡上的记忆体时,
CPU必须透过芯片组(Chipset)、系统记忆体、最后才到达显示卡。
而具备Fast Writes的AGP 4X,可以直接透过Chipset到GeForce256
上写入资料。
    如此一来,当CPU将3D呈像的前两步骤的资料算完后
(Applications Tasks与Scene-level Tasks),就可以直接把结果送
给显示芯片进行后面的运算工作,整体的写入动作少了两次,拉近
CPU与显示芯片距离,直接强化Pipeline的效应。
以Intel 820芯片组为例的标准AGP 4X执行方式
采用Fast Writes的AGP 4X运作模式
    在了解GeForce256所有的特色后,您应该会很想知道到底这么
多的新功能,可以带来多少效益吧,其实我自己都很想知道,所以
在下次的文章,我们将为您介绍nVidia专为GeForce256所撰写的
Demo程序所呈现的特效,及实际的效能测试。
------------------
请接着浏览“GeForce256 性能大剖析(下)”。

--
浪迹天涯从此并肩看彩霞!!!


        欢迎访问我的网站——易 得  驱   动 !  !   !

                        ——http://software.fanso.com/

※ 来源:.紫 丁 香 bbs.hit.edu.cn.[FROM: 166.111.158.17]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:2.597毫秒