Intel finalmente compartilha os segredos de Haswell, revela novos trabalhos em chips de ultra-baixo consumo de energia

Wafers de CPU Intel

A Conferência Internacional de Circuitos de Estado Sólido (ISSCC) é esta semana e é um momento em que empresas e pesquisadores se encontram para discutir os avanços de ponta em tecnologia de semicondutores. A Intel está fazendo várias apresentações na conferência este ano, com novos detalhes sobre o futuro da computação de baixo consumo e algumas informações até então desconhecidas sobre CPUs Haswell.

Haswell: O diabo está nos detalhes

Quando a Intel lançou uma versão do Haswell com 40 unidades de execução de GPU e 128 MB no pacote de EDRAM, codinome Crystal Well, ela foi tímida com muitos dos detalhes. Tamanho da matriz, velocidade do relógio e estrutura organizacional foram varridos para debaixo do tapete - até agora. Agora sabemos que o Crystal Well EDRAM é um chip separado (mas no pacote) de 77 milímetros quadrados com clock de 1,6 GHz e voltagem operacional de 1 V. A interface entre a CPU / GPU e o Crystal Well é chamada de OPIO (no pacote I / O) e é um design simples e flexível que a Intel implantou em duas formas. Em chips Haswell-ULT (ultra-low power), o link OPIO é uma ponte de 4 GB / seg entre o Platform Controller Hub e o resto do núcleo. Quando implantado junto com o Crystal Well, o OPIO pode transferir 102 GB / s - a um custo nominal de apenas 1W de potência.



Crystalwell

Slide cortesia de Anandtech



Outras divulgações que a empresa fez confirmaram algumas de nossas especulações de um ano atrás. Quando a Intel anunciou que Haswell teria um regulador de tensão na matriz, especulamos que o FIVR (Regulador de tensão totalmente integrado) foi uma medida que a Intel deu a fim de acelerar seu tempo de transição de inativo para carga total e vice-versa. 0W se tornou o novo 1 GHz - quanto mais rápido um chip pode entrar e sair do modo inativo, mais potência ele pode oferecer para tarefas específicas e mais energia pode economizar nas transições.

Conforme relata a Anandtech, nossa especulação nesta frente parece ter sido correta. O FIVR é altamente eficiente (90% sob carga) e pode entrar / sair do modo de espera em 320 nanossegundos e atingir o Turbo completo em apenas 100 nanossegundos.



As informações finais específicas de Haswell são os tamanhos de matrizes que a Intel finalmente revelou para suas várias peças.

Haswell morre

Tamanhos de matrizes Haswell em escala.

As peças GT3e quad-core (ou seja, o EU de 40 núcleos completo combinado com 128 MB de memória) são bastante grandes, 260 mm quadrados para a CPU / GPU e 77 mm quadrados adicionais para a memória. Um quad-core convencional com design GT2 (20 EUs) tem apenas 177 mm quadrados. Olhando o núcleo 4 + 2 contra o núcleo 4 + 3, é óbvio que a Intel desistiu de alguma densidade de transistor para atingir seus alvos de integração no topo de a pilha.



As configurações do GT3e “Iris Pro” foram enviadas apenas em alguns sistemas até agora, mas esperamos ver a estreia do núcleo de forma mais ampla com o advento de Broadwell. A Intel pode não estar perseguindo o objetivo da AMD de HSA e integração total de GPU, mas mudar para um nó de processo menor ainda dará a ela mais espaço para se dedicar a impulsionar o desempenho da GPU - e Broadwell deve ser um salto considerável em comparação com Haswell.

A eficiência de longo prazo salta

Uma área de pesquisa contínua para todas as empresas de semicondutores é a questão da eficiência energética. Com a escala de tensão convencional não mais se movendo em níveis anteriores a 2005, empresas como a Intel e a AMD criaram sistemas de controle de clock e gerenciamento de energia cada vez mais sofisticados para garantir que a energia total do sistema seja mantida o mais baixo possível. Em 2012, a Intel apresentou Claremont, um design Intel Pentium implementado em 32nm que usava Tensão quase limite tecnologia para reduzir drasticamente seu poder operacional.

Voltagem Intel quase limite

Hoje, a Intel mostrou alguns de seus esforços nesta área desde o lançamento de Clairemont. A empresa projetou um núcleo gráfico que é capaz de 2,7x a eficiência de gigaflops por watt de um núcleo de GPU convencional, enquanto mantém uma vantagem de desempenho de pico de 1,4x GFLOPS / W. Em outras palavras, o chip é 2,7x mais eficiente em tensões de operação padrão em 1,4x mais eficiente no pico de tensão de operação (presumivelmente, isso está mais próximo do Modo Turbo moderno).

Núcleo gráfico de última geração

Esses artigos de tecnologia são entregues em prosa seca e técnica, mas tocam em conceitos que são vitais para o futuro de longo prazo da computação. Se os vestíveis vão se tornar mais do que curiosidades semifuncionais, eles precisam de núcleos de CPU que possam funcionar de 2 a 3 vezes mais tempo e executar muito mais trabalho no mesmo envelope. Construir supercomputadores de nível exascale e simular o cérebro humano em tempo real requer circuitos muito mais eficientes do que qualquer coisa que construímos até hoje.

As melhorias iterativas estreando em 2014 com produtos como Broadwell ou as plataformas Beema e Mullins da AMD podem parecer muito distantes dos avanços previstos por trabalhos como esses, mas há uma ligação direta entre os dois que remonta a anos. As tecnologias reveladas em 2014 serão as tecnologias que tornam computação exascale possível no início de 2020.

Copyright © Todos Os Direitos Reservados | 2007es.com